前言
最近在处理各种数据
数据源一般有 普通文本、Access、csv、MSSQL等,比较杂乱
而针对不同格式的处境,又要编写不同的脚本,将数据整理之后放入到MongoDB中
记录如下:
文本格式
场景: 存在相同格式的多个文本数据,文件结构如下
代码实现
由于数据不便于公开,所以之贴出部分关键代码
具体思路是从文件中读取数据后拼接成dict,然后append到list里
最后在通过pymongo的insert_many将list插入到MongoDB中
|
|
SQL Server
对于SQL Server的数据源,一般是mdf文件;直接附加到SQL Server 数据库中然后通过Python连接到数据库(使用pyodbc),执行SQL语句……
代码实现
部分敏感字段已删除
|
|
补充
又有一个场景是像弄两个MongoDB的数据整合
于是就用Python编写了个多线程脚本,不断充源数据库中读取数据后存放到目标数据库中,代码如下
|
|
如果需要结合screen的话,可以通过screen -d -m 将相关任务放到screen中