第1关：HBase Shell 操作：分区压缩

内存中的数据 Flush 刷写到硬盘上以后，会对当前 Store 中的文件进行判断，当数量达到阈值，则会触发 Compaction。Hbase 中 MemStore 中不断进行 flush 刷写操作，就会产生多个 storeFile 的文件，当 storeFile 文件达到一定阈值后，Hbase 就会将 Region 中的 Store 中的一些 HFile 进行合并。Major 操作是对 Regi

dream colorful

3036人浏览 · 2024-03-26 22:02:18

dream colorful · 2024-03-26 22:02:18 发布

任务描述

本关任务：在 HBase Shell 中使用分区压缩命令并将查看到的命令结果复制到指定的文件中。

编程要求

请根据左侧知识点的描述，在右侧图形化界面中的终端中使用 HBase Shell (在使用 HBase Shell 之前别忘了开启 Hadoop 集群和 Zookeeper 集群)的分区压缩命令并将结果按要求复制到/opt/answer(answer 文件需要自己创建)文件下。

具体自动拆分配置要求如下所述：

要求创建的表名为: stu;

要求创建的列族为: info;

要求使用的分区压缩命令为：major_compact。

HBase Shell 中操作示例步骤如下：

创建表：
create 'test','f1'
每 put 一条数据 flush 刷写一次：
put 'test','12154646','f1:sex','w'
flush 'test'
最后执行命令：
major_compact 'test'

使用合并时考虑数据一致性，不会马上删掉数据，可以在使用压缩命令之前在 Linux 命令行使用hdfs dfs -ls来查看以下的目录：

hdfs dfs -ls /hbase/data/default/表名/xxxxxxxxxx(一长串数字)/列族名

可以查看到如下图所示：

Kafka logo

使用 major_compact 命令一段时间后可以看到如下图所示：

Kafka logo

对于最后结果复制具体操作为在 Linux 命令行中输入以下命令：

进入 HBase 安装目录：
cd /app/hbase
查看 Hdfs 上合并之后的具体内容可以使用 HFile 命令，并将结果输入到/opt/answer：
bin/hbase org.apache.hadoop.hbase.io.hfile.HFile -p -f /hbase/data/default/stu/xxxxxxxxxx(一长串数字)/info/xxxxxxxxxx(一长串数字) > /opt/answer

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，达到编程要求即会通过。

开始你的任务吧，祝你成功！

命令行：
root@educoder:~# start-all.sh

root@educoder:~# zkServer.sh start

root@educoder:~# cd /opt
root@educoder:/opt# touch answer
root@educoder:/opt# cd
root@educoder:~# start-hbase.sh

root@educoder:~# hbase shell

hbase(main):001:0> create 'stu','info'
0 row(s) in 2.5330 seconds

=> Hbase::Table - stu

///因为测试要求是Scanned kv count -> 4 显示4个键值对 所以创建4个

hbase(main):002:0> put 'stu','1','info:a','a'
0 row(s) in 0.0750 seconds

hbase(main):003:0> put 'stu','2','info:b','b'
0 row(s) in 0.0080 seconds

hbase(main):004:0> put 'stu','3','info:c','c'
0 row(s) in 0.0080 seconds

hbase(main):005:0> put 'stu','4','info:d','d'
0 row(s) in 0.0080 seconds

hbase(main):006:0> flush 'stu'
0 row(s) in 0.2920 seconds

hbase(main):007:0> major_compact 'stu'
0 row(s) in 0.0330 seconds

root@educoder:~# hdfs dfs -ls /hbase/data/default/stu


Found 3 items
drwxr-xr-x   - root supergroup          0 2024-03-26 13:48 /hbase/data/default/stu/.tabledesc
drwxr-xr-x   - root supergroup          0 2024-03-26 13:48 /hbase/data/default/stu/.tmp
drwxr-xr-x   - root supergroup          0 2024-03-26 13:51 /hbase/data/default/stu/8bd07c6adfb5b889ef0db31758b8a86c

stu后面这里显示的是我自己的 不要复制我的

///寻找另一个长数字

root@educoder:~# hdfs dfs -ls /hbase/data/default/stu/8bd07c6adfb5b889ef0db31758b8a86c/info


Found 1 items
-rw-r--r--   1 root supergroup       5043 2024-03-26 13:51 /hbase/data/default/stu/8bd07c6adfb5b889ef0db31758b8a86c/info/adbadaf001c749a494f9c5a6df369740
///两个长段数字都找到了

root@educoder:~# cd /app/hbase
root@educoder:/app/hbase# bin/hbase org.apache.hadoop.hbase.io.hfile.HFile -p -f /hbase/data/default/stu/8bd07c6adfb5b889ef0db31758b8a86c/info/adbadaf001c749a494f9c5a6df369740 > /opt/answer