nwcd-samples / pystathbase

从两个hbase集群拉去数据进行对比的校验工具

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

PyStatHbase

使用happybase 库,通过抽样的方式 校验两个hbase集群相同数据表的数据是否一致

快速使用

使用

  1. 建议创建一个新的python3 运行环境
python3 -m venv new_py_env
source ~/new_py_env/bin/active
  1. 安装依赖
pip install -r requirement.txt
  1. 修改conf.json
{
    "host_source": "172.31.13.109:9090", # 源端的主节点地址+端口
    "host_target": "172.31.12.101:9090", # 目标端的主节点地址+端口
    "remedy": true, # 校验中,发现目标端数据和远端不一致后(不一致或者缺失),是否要修复目标端数据
    "tables": [
        {
            "name": "sales", # 表名
            "begin_prefix": "01f41001", #  范围前缀
            "end_prefix": "0259d608" # 范围后缀
        },
        {
            "name": "sales",
            "begin_prefix": "00fe7daf",
            "end_prefix": "01f5ca24-1d3e"
        },
        {
            "name": "app",
            "begin_prefix": "v1_20220311232",
            "end_prefix": "v3_20220311232"
        }
    ]
}
  1. 保证程序的运行环境和两个数据库集群网络通
telnet xxxx 3306
  1. 运行代码
python3 statm.py conf.json

About

从两个hbase集群拉去数据进行对比的校验工具


Languages

Language:Python 100.0%