安装Hadoop在Linux上需要执行以下步骤:
下载Hadoop软件包:前往Apache Hadoop官方网站(https://hadoop.apache.org/)下载最新的Hadoop版本。
或者使用以下命令从终端下载Hadoop软件包:
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz解压Hadoop软件包:tar -xzvf hadoop-3.3.1.tar.gz配置Hadoop环境变量:编辑~/.bashrc文件:vim ~/.bashrc添加以下内容:# Hadoop Configurationexport HADOOP_HOME=/path/to/hadoop-3.3.1export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin保存并退出文件。
执行以下命令以使环境变量生效:
source ~/.bashrc配置Hadoop:进入Hadoop的配置目录:cd /path/to/hadoop-3.3.1/etc/hadoop编辑hadoop-env.sh文件并修改Java路径:vim hadoop-env.sh将以下行修改为正确的Java路径:
export JAVA_HOME=/path/to/java保存并退出文件。配置Hadoop集群:编辑core-site.xml文件并添加以下配置:<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property></configuration>编辑hdfs-site.xml文件并添加以下配置:<configuration><property><name>dfs.replication</name><value>1</value></property></configuration>格式化Hadoop文件系统:hdfs namenode -format启动Hadoop集群:start-dfs.sh现在,您已经在Linux上成功安装和启动了Hadoop。您可以通过访问http://localhost:9870来查看Hadoop集群的Web界面。