From 140b486ba0406efdd82df4390e69ed79778a5867 Mon Sep 17 00:00:00 2001 From: xxzuo <1293378490@qq.com> Date: Mon, 1 Aug 2022 23:49:58 +0800 Subject: [PATCH] blog update --- .../azkaban\346\216\245\345\217\243.md" | 18 +- source/_posts/datanode.md | 61 ++++++ ...70\347\224\250\345\221\275\344\273\244.md" | 74 +++++++ ...03\346\225\260\346\215\256\345\272\223.md" | 183 ++++++++++++++++++ 4 files changed, 327 insertions(+), 9 deletions(-) create mode 100644 source/_posts/datanode.md create mode 100644 "source/_posts/hadoop\345\270\270\347\224\250\345\221\275\344\273\244.md" create mode 100644 "source/_posts/hive\345\205\203\346\225\260\346\215\256\345\272\223.md" diff --git "a/source/_posts/azkaban\346\216\245\345\217\243.md" "b/source/_posts/azkaban\346\216\245\345\217\243.md" index 6acf872..eec675d 100644 --- "a/source/_posts/azkaban\346\216\245\345\217\243.md" +++ "b/source/_posts/azkaban\346\216\245\345\217\243.md" @@ -34,18 +34,18 @@ categories: * 请求参数说明: - | 名称 | 类型 | 必填 | 说明 | - | ------------ | ------ | ---- | -------- | - | action=login | string | true | 登录参数 | - | username | string | true | 用户名 | - | password | string | true | 用户密码 | + | 名称 | 类型 | 必填 | 说明 | + | ------------ | ------ | ---- | -------- | + | action=login | string | true | 登录参数 | + | username | string | true | 用户名 | + | password | string | true | 用户密码 | * 返回参数说明: - | 名称 | 类型 | 说明 | - | ---------- | ------ | -------- | - | status | int | 状态码 | - | session.id | string | 会话ID | + | 名称 | 类型 | 说明 | + | ---------- | ------ | ------ | + | status | int | 状态码 | + | session.id | string | 会话ID | * JSON返回示例: diff --git a/source/_posts/datanode.md b/source/_posts/datanode.md new file mode 100644 index 0000000..20ddda0 --- /dev/null +++ b/source/_posts/datanode.md @@ -0,0 +1,61 @@ +--- +title: datanode +author: xxzuo +date: 2022-07-31 14:59:16 +tags: +- hdfs +categories: +- 大数据 +--- + + + +# DATANODE工作机制 + +### DataNode启动流程 + +1. DataNode 启动后主动向 NameNode 注册 +2. 注册成功后,NameNode会把DataNode注册在元数据中 +3. 注册成功以后每周期(默认6小时),DataNode向NameNode上报信息(块完好) +4. 心跳每3秒一次,心跳返回结果带有NameNode给DataNode的命令,比如复制数据块到另一台机器,或者删除某个数据块等等(DataNode没挂) +5. 超过10分钟+30秒 收到DataNode 的心跳,则认为该节点不可用,此时NameNode 就不会对该文件块进行读写 + + + +### DataNode数据存储 + +一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件 + +- 数据本身 +- 元数据:数据块的长度、数据块的校验、时间戳 + + + +### 参数配置 + +DN向NN汇报当前解读信息的时间间隔,默认6小时 + +```xml +dfs.blockreport.intervalMsec +``` + + + +DN扫描自己节点块信息列表的时间,默认6小时 + +```xml +dfs.datanode.directoryscan.interval +``` + + + + + + + + + + + + + diff --git "a/source/_posts/hadoop\345\270\270\347\224\250\345\221\275\344\273\244.md" "b/source/_posts/hadoop\345\270\270\347\224\250\345\221\275\344\273\244.md" new file mode 100644 index 0000000..6f0e464 --- /dev/null +++ "b/source/_posts/hadoop\345\270\270\347\224\250\345\221\275\344\273\244.md" @@ -0,0 +1,74 @@ +--- +title: hadoop常用命令 +author: xxzuo +date: 2022-08-01 23:10:41 +tags: +- hadoop +categories: +- 大数据 +--- + + + +## hdfs常用命令 + +查看文件列表 + +```bash +hadoop fs -ls +``` + +递归查看文件 + +```bash +hadoop fs -ls -R +``` + +上传文件 + +```bash +hadoop fs -put +``` + +创建目录 + +```bash +hadoop fs -mkdir +``` + +递归删除 + +```bash +hadoop fs -rm -r +``` + +查看空间使用情况 + +```bash +hadoop fs -df -h +``` + +查看文件内容 + +```bash +hadoop fs -cat +``` + + + + + +## yarn常用命令 + +查看yarn job + +```bash +yarn application -list +``` + +kill yarn job + +```bash +yarn application -kill +``` + diff --git "a/source/_posts/hive\345\205\203\346\225\260\346\215\256\345\272\223.md" "b/source/_posts/hive\345\205\203\346\225\260\346\215\256\345\272\223.md" new file mode 100644 index 0000000..a94299e --- /dev/null +++ "b/source/_posts/hive\345\205\203\346\225\260\346\215\256\345\272\223.md" @@ -0,0 +1,183 @@ +--- +title: hive元数据库 +author: xxzuo +date: 2022-07-28 22:18:58 +tags: +- hive +categories: +- 大数据 +--- + + + +# hive元数据库 + +## 配置 +查看 hive-site.xml 内容 + +```xml + + javax.jdo.option.ConnectionURL + jdbc:mysql://localhost:3306/hive_meta?useUnicode=true&characterEncoding=UTF-8&autoReconnect=true&maxReconnects=10&useSSL=false + + + + javax.jdo.option.ConnectionDriverName + com.mysql.jdbc.Driver + + + + javax.jdo.option.ConnectionUserName + username + + + + javax.jdo.option.ConnectionPassword + password + +``` + + +## hive元数据表信息 + +| 表名 | 注释 | +| ----------------------------------- | ---------- | +| AUX_TABLE | | +| BUCKETING_COLS | | +| CDS | | +| COLUMNS_V2 | 字段信息 | +| COMPACTION_QUEUE | | +| COMPLETED_COMPACTIONS | | +| COMPLETED_TXN_COMPONENTS | | +| CTLGS | | +| [DATABASE_PARAMS](#database_params) | 数据库参数 | +| [DBS](#dbs) | 数据库信息 | +| DB_PRIVS | | +| DELEGATION_TOKENS | | +| FUNCS | | +| FUNC_RU | | +| GLOBAL_PRIVS | | +| HIVE_LOCKS | | +| IDXS | | +| INDEX_PARAMS | | +| I_SCHEMA | | +| KEY_CONSTRAINTS | | +| MASTER_KEYS | | +| MATERIALIZATION_REBUILD_LOCKS | | +| METASTORE_DB_PROPERTIES | | +| MIN_HISTORY_LEVEL | | +| MV_CREATION_METADATA | | +| MV_TABLES_USED | | +| NEXT_COMPACTION_QUEUE_ID | | +| NEXT_LOCK_ID | | +| NEXT_TXN_ID | | +| NEXT_WRITE_ID | | +| NOTIFICATION_LOG | | +| NOTIFICATION_SEQUENCE | | +| NUCLEUS_TABLES | | +| PARTITIONS | | +| PARTITION_EVENTS | | +| PARTITION_KEYS | | +| PARTITION_KEY_VALS | | +| PARTITION_PARAMS | | +| PART_COL_PRIVS | | +| PART_COL_STATS | | +| PART_PRIVS | | +| REPL_TXN_MAP | | +| ROLES | | +| ROLE_MAP | | +| RUNTIME_STATS | | +| SCHEMA_VERSION | | +| SDS | | +| SD_PARAMS | | +| SEQUENCE_TABLE | | +| SERDES | | +| SERDE_PARAMS | | +| SKEWED_COL_NAMES | | +| SKEWED_COL_VALUE_LOC_MAP | | +| SKEWED_STRING_LIST | | +| SKEWED_STRING_LIST_VALUES | | +| SKEWED_VALUES | | +| SORT_COLS | | +| TABLE_PARAMS | | +| TAB_COL_STATS | | +| TBLS | 表信息 | +| TBL_COL_PRIVS | | +| [TBL_PRIVS](#tbl_privs) | 表权限信息 | +| TXNS | | +| TXN_COMPONENTS | | +| TXN_TO_WRITE_ID | | +| TYPES | | +| TYPE_FIELDS | | +| [VERSION](#version) | hive版本 | +| WM_MAPPING | | +| WM_POOL | | +| WM_POOL_TO_TRIGGER | | +| WM_RESOURCEPLAN | | +| WM_TRIGGER | | +| WRITE_SET | | + + +## hive元数据表详情 + +### VERSION(存储Hive版本的元数据表) + +| 字段名 | 注释 | +| --------------- | -------- | +| VER_ID | 主键 | +| SCHEMA_VERSION | Hive版本 | +| VERSION_COMMENT | 版本说明 | + + +### DBS(存储数据库信息) + +| 字段名 | 注释 | +| --------------- | ---------------- | +| DB_ID | 主键 | +| DESC | 数据库描述 | +| DB_LOCATION_URI | hdfs路径 | +| NAME | 数据库名称 | +| OWNER_NAME | 数据库所有者名称 | +| OWNER_TYPE | 数据库所有者角色 | +| CTLG_NAME | catalog名称 | + + + +### DATABASE_PARAMS(存储数据库参数信息) + +| 字段名 | 注释 | +| ----------- | -------- | +| DB_ID | 数据库ID | +| PARAM_KEY | 参数名 | +| PARAM_VALUE | 参数值 | + + + +### DB_PRIVS(数据库权限信息) + +| 字段名 | 注释 | +| -------------- | -------- | +| DB_GRANT_ID | 主键ID | +| CREATE_TIME | 创建时间 | +| DB_ID | 数据库ID | +| GRANT_OPTION | | +| GRANTOR | | +| GRANTOR_TYPE | | +| PRINCIPAL_NAME | | +| PRINCIPAL_TYPE | | +| DB_PRIV | | +| AUTHORIZER | | + + + + + + + +### TBL_PRIVS(表权限) + +| 字段名 | 注释 | +| ------ | ---- | +| | | +| | | +| | |