hadoop3.x教程目录 作者:马育民 • 2021-11-10 17:31 • 阅读:18534 centos教程目录基础部署伪分布式部署集群部署常见错误总结HDFSSecondaryNameNode(2NN)dn命令开发读写数据流程压缩编译源码常用其他常见问题 centos教程目录基础 hadoop3.x 介绍 hadoop目录结构 hadoop3.x 组成介绍 部署 hadoop3.x部署方式 伪分布式部署 hadoop3.x伪分布式部署-准备linux环境 hadoop3.x伪分布式部署-linux安装jdk(java) hadoop3.x伪分布式配置HDFS hadoop3.x web管理界面介绍(端口号9870) hadoop3.x伪分布式部署:修改windows hosts文件 hadoop3.x 文件系统常用命令(hadoop fs、hdfs fs) hadoop logs目录和日志文件(.log、.out) hadoop3.x 重新格式化namenode hadoop3.x yarn介绍 hadoop伪分布式配置yarn hadoop3.x 统计词频案例(hadoop-mapreduce-examples)和web管理页面 hadoop:map、reduce 运算简单图解 hadoop3.x 伪分布式配置历史服务(history server) hadoop3.x 伪分布式配置日志聚集(log aggregation) 集群部署 hadoop3.x集群部署-介绍 hadoop3.x集群部署-准备linux环境-设置静态IP hadoop3.x集群部署-准备linux环境 hadoop3.x集群部署-准备linux环境-ssh免密码登录 hadoop3.x集群部署-准备linux环境-时间同步 hadoop3.x集群部署-集群角色和服务器规划 hadoop3.x集群部署-在hadoop1安装jdk hadoop3.x集群部署-在hadoop1安装hadoop hadoop3.x scp命令将hadoop1文件发送给其他电脑 hadoop3.x rsync命令将hadoop1文件同步给其他虚拟机 hadoop3.x集群部署-配置HDFS、yarn、MapReduce hadoop3.x集群部署-格式化NameNode hadoop3.x集群部署-启动、停止NameNode、DataNode、yarn hadoop3.x集群:NameNode web管理界面介绍(端口号9870) hadoop3.x集群:修改windows hosts文件 hadoop3.x集群:yarn web管理界面介绍(端口号8088) hadoop3.x集群:测试上传文件 hadoop3.x yarn介绍 hadoop3.x集群:执行 wordcount 测试 yarn 和 MapReduce hadoop3.x集群:配置、启动历史服务(history server,端口19888) hadoop3.x集群:配置日志聚集(log aggregation) hadoop启动命令:NameNode、DataNode、secondarynamenode、yarn、resourcemanager、nodemanager hadoop3.x集群:编写Hadoop集群启动、停止脚本 常见错误 yarn错误:java.net.BindException: Port in use: 8088 hadoop3.x集群:datanode不同步数据 hadoop3.x集群:挂掉datanode节点如何启动 hadoop3: WARNING: nodemanager did not stop gracefully after 5 seconds: Trying to kill with kill -9 总结 hadoop3.x 常用端口号 配置文件模板 HDFS hadoop:文件系统、元数据、文件系统分类、海量数据存储的问题 HDFS介绍 hadoop3.x:NameNode、DataNode、Secondary NameNode、Client客户端 Hadoop3.x 分块机制和块大小(block size) hadoop3.x:副本机制 hadoop3.x:Namenode和namespace、元数据 SecondaryNameNode(2NN) hadoop3.x:FsImage、Edits作用 hadoop3.x:SecondaryNameNode(2NN)工作机制 hadoop3.x:FsImage镜像文件、FsImage.md5、seen_txid、VERSION内容 hadoop3.x:oiv命令查看 fsimage 文件 hadoop3.x:oev命令查看 edits 文件 hadoop3.x:SecondaryNameNode的checkpoint配置 dn hadoop3.x:DataNode工作机制、blk_xxx数据文件、meta文件 hadoop3.x:DataNode发送信息间隔时间配置 hadoop 数据完整性(数据的一致性)和CRC数据校验文件 命令 hadoop3.x 文件系统常用命令(hadoop fs、hdfs fs) hadoop3.x 文件系统补充命令(hadoop fs、hdfs fs) 开发 hadoop3.x HDFS JAVA开发介绍 hadoop3.x windows搭建 JAVA 开发环境(winutils) hadoop3.x HDFS java第一个例子 hadoop3.x HDFS java上传文件(设置副本参数) hadoop3.x HDFS java下载文件 hadoop3.x HDFS java删除文件 hadoop3.x HDFS java修改文件名、文件夹名和移动文件 hadoop3.x HDFS java遍历文件详细信息(FileSystem.listFiles) hadoop3.x HDFS java显示给定目录下的文件、目录信息(FileSystem的listLocatedStatus、listStatus、listStatusIterator方法) hadoop3.x HDFS java上传文件的源码分析 hadoop3.x HDFS java下载文件的源码分析 读写数据流程 hadoop3.x:HDFS 写流程、Pipeline管道、ACK应答 hadoop3.x:HDFS 写流程-数据复制和副本节点(DataNode)选择 hadoop3.x HDFS读数据流程 hadoop3.x client下载文件时,namenode一次性将block信息发送给客户端 压缩 hadoop3.x:HDFS文件压缩格式 编译源码 hadoop编译源码介绍 hadoop3.x编译源码(centos7平台,支持snappy) 常用 hadoop启动NameNode、DataNode、yarn、history server 其他 hadoop3.x 将普通用户增加到HDFS的超级用户组supergroup hadoop hdfs关闭权限管理 常见问题 hadoop、hdfs报错:Permission denied: user=root, access=WRITE, inode=“/“supergroup:drwxr-xr-x 原文出处:http://malaoshi.top/show_1IXVasYt2DK.html