免责申明

任何使用本工具包造成的现网数据问题和数据库问题概不负责
本工具包使用python3 perl shell编写，建议由一定python基础的人执行
需求环境安装zlib 需求环境安装python3.9及以下类库

cx_Oracle
pymysql
json
pdfminer(选装)

需求环境安装perl 5.010及其以上版本

推荐使用VS CODE编辑json配置文件

使用说明

基本流程

考虑导是现网业务

所有的删除操作都必须转换为单条sql，删除条件必须只对应唯一的一条数据
所有更新操作必须转化为单挑sql，更新条件必须只对应唯一的一条数据
批量插入采用mysql loadfile的形式，插入的数据保存在"|"为分隔符的文本文件

基本逻辑

使用donwload_mysql.py 导出需要修改的表和关联的表
把导出的文件使用load.sh导入到oracle
生成更新，删除，插入的数据
使用unload.sh导出生成的数据
使用工具更新mysql

脚本说明

donwload_mysql.py

执行命令:
py3 donwload_mysql.py

配置文件格式

conn.json
download.json

download.json

{
    "CRMHOT":[
        ["|",[],"order_item"," "],
        ["|",[],"cust_order"," "],
        ["|",[],"cust_contact"," "]

    ],
    "CC":[
        ["|",["SUBS_ID","ACC_NBR"],"SUBS"," where ACC_NBR=1"]  
    ]
}

外层key对应conn.json中配置mysql逻辑数据库名字内存是一个二维数组
其中["|",[],"order_item"," "]

域1 导出文件的分隔符
域2 []内写需要导出的字段名字，如果需要导出全表，则不需要写
域3 导出的表名
域4 where条件注意where前面加一个空格 不支持多表关联

导出的文件在../data目录下文件命规则分片库名字.表名.unl
例如SUBS表，存在四个分片导出的文件在data目录下存在4个文件

CC1.SUBS.unl
CC2.SUBS.unl
CC3.SUBS.unl
CC4.SUBS.unl

注意!!

无论是否下载全表，下载的文件总是会在开头包含2个字段

分片库名字
表名例如 CRMHOT1.CUST_CONTACT.unl
CRMHOT1|cust_contact|113803788|10323275||A|5|2021-05-25 09:57:50|A|F|685244||||2105000113105487||0||257|0|
文件结尾也是有分隔符的

Load.sh

把文本文件导入oracle
执行命令 ./Load.cfg load.cfg /
命令包含两个参数

参数1 配置文件名字
参数2 入库文件位置 /表示在../data目录下

需要配置文件load.cfg 位于../config/目录下配置文件可以叫其他名字取决于参数1

#the file for load.

#three DB: memdb oracle informix
[dbtype]
oracle

#if memdb ,write memdb
[dbname]
username/passwd@IP:port/tns

# max process
[max_process_count]
5

#the number of cpu
[cpuno]
5

#expdb mode
[date only mode]
N

[tablelist]
src_order_item|CRMHOT1.ORDER_ITEM.unl|
src_cust_order|CRMHOT1.CUST_ORDER.unl|
src_cust_contact|CRMHOT1.CUST_CONTACT.unl|
[END]

入库失败日志在 ../log/目录下
入库入库失败日志文件格式名字load_入库文件名.log
如果出现入库失败请检查入库日志

Unload.sh

导出oracle数据库的数据 执行命令
./Unload.sh

需要配置文件unload.cfg

#support 3 kind of db:1:memdb 2:oracle 3:informix
[dbtype]
oracle

#If it is memdb, just write memdb
[dbname]
mig_transfer/smart@10.159.0.35:1521/mtncc

[tablelist]
FIX_cust_contact2|select *from FIX_cust_contact|
[END]

如果是全表导出 select *from *要和from写在一起如果是选择导出部分数据可以写 select column1,column2,column3 from table1 where column=xxx

导出文件在../data目录下
.unl结尾，文件名取决于[tablelist]下配置的第一个域

ora2mysql.pl

把oracle格式的入库文件转换为mysql格式的入库文件
执行命令
perl ora2mysql.pl xxx.tmp

需要传参参数必须是xxx.tmp 会在../data/目录下生成同名的xxx.unl文件 使用Unload.sh下载的数据，需要先在../data/目录下把下载的文件没改成tmp,然后使用这个oracle2mysql.pl转换格式

注意！！

如果使用load_mysql.py脚本导入数据，必须检查文本文件是否符合mysql格式
即对于空字段为\N，结尾没有分隔符
如果强行把oracle格式的文本文件导入mysql会造成在代理上查不到同时在物理库存在的情况
这个时候就需要调用exec_mysql.py去清理掉这些异常数据

load_mysql.py

把mysql格式的文本导入mysql数据库 执行命令
py3 load_mysql.py
导入数据之前先确定是单片表还是分片表
去代理商查一下zddas_sharding_rule表
如果是单片表生成的文本文件需要是每个库一个文件
如果是分片表，只需要一个表生成一个文件

举例：
SUBS_IDENTIFY表，在每个库上是单片表，那么需要根据zdaas_sharding_rule里面的规则，abs(mod(hash_code(identify_value),4)) 生成4个文件，然后用load_mysql.py导入数据库
SUBS表，是分片表，那么只需要生成一个文件，在zdaas_sharding_rule上查到routing_id和sharding_id字段位置用load_mysql.py导入数据

需要配置文件load.json

{
    "CRMHOT":[
        ["normal","CRMHOT1","|","cust_contact","/soft/rec/xyy/data/FIX_cust_contact2.unl"]
    ],
    "CC":[
        ["sharding","|",4,27,32,28,"SPC_BAL_SHARE","/soft/rec/xyy/data/FIX_SPC_BAL_SHARE.unl"]
    ]
}

json格式
如果是单片表
["normal","CRMHOT1","|","cust_contact","/soft/rec/xyy/data/FIX_cust_contact2.unl"]

第一个域 normal表示单片表
第二个域分隔符，如果是普通表写"|", 如果是attr表“;"
第三个域导入的表名
第四个域文件位置如果是分片表 ["sharding","|",4,27,32,28,"SPC_BAL_SHARE","/soft/rec/xyy/data/FIX_SPC_BAL_SHARE.unl"]
第一个域 sharding表示分片表
第二个域 "|" 文件的分隔符
第三个域 routing对于的分库数量
第四个域 routing字段对应的位置，从0开始
第五个域 sharding分片数据量，一般是32
第六个域 sharding字段所在的位置从0开始
第七个域对应逻辑表的表名
第八个域入库文件所在域

警告!! 导入数据库的时候需要先确定1

文本文件是MySQL格式的
pk没用冲突
导入后需要检查是否能在代理上查到数据

exec_mysql.py

批量执行sql语句
执行命令
py3 exec_mysql.py CC ../data/FIX_SCP_SQL.unl

参数一执行SQL的逻辑库名
参数二 SQL文件路径

其中SQL文件格式如下:
sql语句|对应物理库名字| 例如 delete from bal_share_detail where BAL_SHARE_DETAIL_ID=58396|CC1| sql语句不需要";"结尾
举例

select 'UPDATE BILL_BAL_SHARE set EXP_DATE=null where BAL_SHARE_ID=' ||
       b.bal_share_id || ' and SEQ=' || b.seq SQL_TEXT,
       'SPC1' DB
  from SRC_BAL_SHARE_DETAIL a, FIX_BILL_BAL_SHARE_0 b
 where a.bal_share_id = b.bal_share_id
   and (b.update_date is not null or b.exp_date is not null)
   and a.exp_date is null

表名需要是真实的物理表名
download_mysql.py之所以回导出物理库名字和物理表名，就是在这边使用的

需要配置文件conn.cfg

常见操作

批量补数据

如果确认漏数据，确定需要补数据的范围和数据来源的表
使用download_mysql.py下载需要的表，为了节约时间和磁盘空间可以只下载部分字段和部分需要数据
在oracle根据mysql的表结构建立表，一般表名字为SRC_mysql逻辑表名注意表结构需要在头部增加DB VARCHAr2(64) 和 TAB varchar2(64) 两列例如

create table SRC_ACCT
(
  db                         VARCHAR2(32),
  tab                        VARCHAR2(32),
  acct_id                    NUMBER(12) not null,
  std_addr_id                NUMBER(15),
  payment_method_id          NUMBER(3),
  cust_bill_delivery_info_id NUMBER(12),
  parent_acct_id             NUMBER(12),
  cust_id                    NUMBER(12),
  bill_address               VARCHAR2(255),
  acct_nbr                   VARCHAR2(60) not null,
  acct_name                  VARCHAR2(120),
  billing_cycle_type_id      NUMBER(6) not null,
  payment_type               CHAR(1) not null,
  bank_id                    NUMBER(6),
  bank_acct_nbr              VARCHAR2(60),
  bank_acct_name             VARCHAR2(120),
  bank_acct_exp_date         DATE,
  payment_comments           VARCHAR2(255),
  bank_card_type             NUMBER(6),
  created_date               DATE not null,
  update_date                DATE not null,
  state                      CHAR(1) not null,
  state_date                 DATE not null,
  postpaid                   CHAR(1),
  routing_id                 NUMBER(6),
  bill_format_id             NUMBER(6),
  default_flag               CHAR(1),
  is_lock                    CHAR(1),
  party_type                 CHAR(1),
  party_code                 VARCHAR2(60),
  need_upload                CHAR(1),
  bill_flag                  CHAR(1),
  bill_currency              NUMBER(9),
  sp_id                      NUMBER(6),
  bank_acct_issue_date       DATE,
  def_lang_id                NUMBER(6),
  allow_mod_state_date       DATE,
  last_order_item_id         NUMBER(16),
  seq                        NUMBER(6),
  previous_seq               VARCHAR2(120),
  upload_date                DATE
)

建立对应的需要补数据的表的结构,一般以FIX_表名，表结构必须和mysql逻辑表一致
配置load.cfg 把从MySQL下载的数据导入Oracle
根据逻辑往FIX_XXX表插入需要补充的数据
配置unload.cfg 使用Unload.sh下载数据
修改下载数据的后缀为tmp
使用ora2mysql.pl把下载的文件转换为mysql格式
使用load_mysql脚本导入mysql

批量修改数据

原理同上，只是需要生成批量执行的SQL文件然后在把sql文件下载下来就行了

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

readme.md

readme.md

免责申明

使用说明

基本流程

基本逻辑

脚本说明

donwload_mysql.py

注意!!

Load.sh

Unload.sh

ora2mysql.pl

注意！！

load_mysql.py

exec_mysql.py

常见操作

批量补数据

批量修改数据

Files

readme.md

Latest commit

History

readme.md

File metadata and controls

免责申明

使用说明

基本流程

基本逻辑

脚本说明

donwload_mysql.py

注意!!

Load.sh

Unload.sh

ora2mysql.pl

注意！！

load_mysql.py

exec_mysql.py

常见操作

批量补数据

批量修改数据