python整理聊天记录（Python爬虫好友聊天记录）_网站入侵_黑客接单网

python整理聊天记录（Python爬虫好友聊天记录）

hacker 网站入侵 1条留言 197 次浏览 3年前 (2022-05-31) [编辑]

本文导读目录：

1、微信聊天记录使用python爬虫到底能采集吗

2、python将微信聊天内容复制到word文档？

3、python能看微信记录吗

4、python 正则表达式匹配多行聊天记录的问题。

5、求python收集微信聊天记录代码每天收集同事们通过微信向我汇报工作情况，汇总成excel表格

6、python 能抓去微信的聊天记录吗

7、可以用python爬我的微信聊天记录吗

微信聊天记录使用python爬虫到底能采集吗

首先，下载互盾苹果恢复大师，先安装好备用。

第二，打开“互盾苹果恢复大师”软件，看到界面上“从iTunes备份文件中恢复”，点击即可。

第三，此时你可以看到软件正在扫描手机数据，等待扫描完成即可。

第四，扫描完成后，可以看到界面上有“微信”、“短信”等栏目显示，点击“微信”即可恢复微信的内容。

最后，点击“微信”后可以在右侧直接看到内容，也可以选择“导出”。

python整理聊天记录

python将微信聊天内容复制到word文档？

python 有一个第三方库 pywx 你可以去看看，了解一下，然后匹配特定聊天记录的话可以试着用正则试试

望采纳

python能看微信记录吗

导出微信聊天db文件

手机端导出

发现现在的Android手机都很难root，而db文件肯定在微信的应用目录下。拿不出来的。

电脑端导出（mac）

从~/Library/Containers/com.tencent.xinWeChat/Data/Library/Application\ Support/com.tencent.xinWeChat下找到对应账号的数据存储目录。

屏幕快照 2019-10-17 下午5.46.38.png

Message

存储聊天消息

Contact

存储联系人信息

获取db密钥

打开微信

命令行运行 lldb -p $(pgrep WeChat)

在 lldb 中输入 br set -n sqlite3_key，回车

还是在 lldb 中，输入 c, 回车

扫码登录微信

这时候回到 lldb 界面, 输入 memory read --size 1 --format x --count 32 $rsi, 回车

命令行回显结果

0x000000000000: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

0x000000000008: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

0x000000000010: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

0x000000000018: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

忽略左边的地址（ 0x000000000000: ，0x000000000008:），从左到右，从上到下，把形如 0xab 0xcd 的数据拼起来，然后去掉所有的 "0x"和空格、换行, 得到 64 个字符的字符串，这就是微信数据库的 key

可以遇到的问题(来自网上，我在使用过程中没有这个问题))

*.db 文件要在另一台 PC 或 Mac 上登录微信，才能被关闭，否则里面的聊天记录不是最新的；当然也可以强制调用 wal_checkpoint, 不过作为土办法，在另一台电脑上登一下微信也无妨。

那么wal_checkpoint是什么？是一个sqlite命令，可以参考：https://www.sqlite.org/pragma.html#pragma_wal_checkpoint，如果不想看英文，那就百度一下吧！

db browser for sqlite

db数据库可视化工具，打开需要查看的数据库文件：

屏幕快照 2019-10-17 下午6.43.43.png

先输入0x，然后把上面得到的密钥复制进来。由于编码的问题，可能复制进来会出现打不开的情况，你可以先把密钥复制到软件执行sql语句的地方，然后在复制。一会python读取db数据库会参考上面的设置参数。

python解密db数据库

这里需要使用sqlite来操作数据库，而sqlite本身是不支持加密和解密的，那么这部分就需要我们自己来完成，但是网上已经有开源库了。

使用到的python库

加密解密db库——pysqlcipher3。

加密算法库——sqlcipher。

微信db加密库——wcdb

参考文档

https://docs.python.org/2/library/sqlite3.html#cursor-objects

db解密

路径配置

# 加密DB文件绝对路径,微信DB加密方案参考： https://github.com/Tencent/wcdb

DB_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/encryption/'

# 解密后生成不加密DB文件绝对路径

DB_OUT_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/decrypt/'

DB_OUT_JSON_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/json/'

DB_ROOT_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/'

# 解密数据库key

DB_KEY = "x''1133d3dd61764a9e80699b42b61e443515aeb00cf4f5497d9729adcb6c8e78e2''"

# 新的DB加密数据KEY，如果为空，者不加密

DB_NEW_KEY = ''

这里说一下DB_KEY的写法，官网写法是这样的："x'2DD29CA851E7B56E4697B0E1F08507293D761A05CE4D1B628663F411A8086D99'";但是这样写始终是不能打开数据库的，始终报“不是一个数据库文件”。换成上面的写法后可以打开。所以，这里如果不能打开，把这两种写都试一试。像在密钥前加'0x'等都可以试一试。

解密

import pysqlcipher3.dbapi2 as sqliteimport config as cfdef decrypt(path, fileName):

# ———————————————————————————————————数据库操作———————————————————————————————————

# 参考：https://www.sqlite.org/pragma.html#pragma_wal_checkpoint

# 连接数据库如果文件不存在，会自动在当前目录创建:

db = sqlite.connect(path + fileName)

# 创建一个Cursor:

db_cursor = db.cursor()

# ————————————————————————————————————解密数据DB———————————————————————————————————

# sqlcipher加密解密参考：https://github.com/sqlcipher/android-database-sqlcipher/issues/94

# sqlcipher开源库地址：https://github.com/sqlcipher/sqlcipher/issues

# sqlcipherApi：https://www.zetetic.net/sqlcipher/sqlcipher-api/

db_cursor.execute("PRAGMA key='" + cf.DB_KEY + "';")

db_cursor.execute("PRAGMA cipher_compatibility=3;")

db_cursor.execute("PRAGMA cipher_page_size=1024;")

db_cursor.execute("PRAGMA kdf_iter=64000;")

db_cursor.execute("PRAGMA cipher_hmac_algorithm=HMAC_SHA1;")

db_cursor.execute("PRAGMA cipher_kdf_algorithm=PBKDF2_HMAC_SHA1;")

# 将解密文件导入新的DB文件

decrypt = cf.DB_OUT_PATH + 'decrypt_' + fileName

db_cursor.execute("ATTACH DATABASE '" + decrypt + "' AS db_de KEY '" + cf.DB_NEW_KEY + "'; -- empty key will disable encryption")

db_cursor.execute("SELECT sqlcipher_export('db_de');")

db_cursor.execute("DETACH DATABASE db_de;")

db_cursor.close()

更多加密参数设置参考：sqlcipher使用文档

将数据库导出为json

import pysqlcipher3.dbapi2 as sqliteimport config as cf_wximport dbToJsondef parse(path, fileName):

db = sqlite.connect(path + fileName)

db_cursor = db.cursor()

all_table = db_cursor.execute("SELECT name FROM sqlite_master WHERE type = 'table';").fetchall()

print(all_table)

for x in all_table:

table_name = x[0]

print("Searching", table_name)

try:

t = db_cursor.execute('SELECT * FROM ' + table_name + ';')

dbToJson.tableToFile(db_cursor,table_name)

print('\n')

except BaseException as e:

print(e)

continue

db_cursor.close()

db.close()

import jsonimport numpy as npimport config as cf_wxclass MyEncoder(json.JSONEncoder):

def default(self, obj):

if isinstance(obj, np.ndarray):

return obj.tolist()

elif isinstance(obj, bytes):

# utf-8会报错：'utf-8' codec can't decode byte 0xfc in position 14: invalid start byte

return str(obj, encoding='ISO-8859-15')

return json.JSONEncoder.default(self, obj)def tableToJson(cursor, table):

query = 'SELECT * FROM ' + table

rows = cursor.execute(query)

items = []

for row in rows:

item = {}

for key in cursor.description:

item.update({key[0]: value for value in row})

items.append(item)

# 注意不要写道for里面了，不然数据结果不对

js = json.dumps(items, ensure_ascii=False, cls=MyEncoder, indent=4)

print(js)

print('--------------------------------')def tableToFile(cursor, table):

query = 'SELECT * FROM ' + table

rows = cursor.execute(query)

items = []

for row in rows:

item = {}

# 参考：https://stackoverflow.com/questions/3300464/how-can-i-get-dict-from-sqlite-query

for idx, col in enumerate(cursor.description):

value = row[idx]

item.update({col[0]: value})

items.append(item)

# 注意不要写道for里面了,不然数据结果不对

json_name = ""

if(table.endswith('.db')):

json_name = table[:(table.__len__ - 3)]

else:

json_name = table file = open(cf_wx.DB_OUT_JSON_PATH + json_name + ".json", 'w+')

# ensure_ascii默认为True,汉字会被编码成'\u4e00\u6839\u806a'

js = json.dumps(items, ensure_ascii=False, cls=MyEncoder, indent=4)

file.write(js)

file.close()

关联

查看聊天消息数据发现，不能把聊天消息数据表和对应的聊天人对应起来，因为消息表并没有存是和谁在聊天。如果不能和对应的人联系起来，岂不是感觉很不好。那这里就要用到联系人数据库了，密钥和上面的一样。打开联系人的数据查看：

屏幕快照 2019-10-17 下午7.30.41.png

这是其中一个联系人，将"m_nsUsrName"进行32 MD5后得到32为字符串。在者字符串前面加上"Chat_"就是这个联系人在消息数据库里面对应的表名。这样就可以通过这个字符串在消息数据库里找到对应的聊天消息了。

python 正则表达式匹配多行聊天记录的问题。

如果你所指得[任意文字]的意思是1个或1个以上文字得话

你可以试试下面得语句

p = re.compile(u'.*想知道.+\n.+也想知道.+')

否则你只需要将里面得"+"改为"*"就可以匹配0得情况

也就是下面得语句

p = re.compile(u'.*想知道.*\n.*也想知道.*')

测试代码如下：

a = u"""我想知道。

..... 我也想知道。"""

p.search(a)

_sre.SRE_Match object at 0x1014d5100

看了你的问题补充，如果你想要查找出字符串中最后匹配的子字符串的话，我目前没想到比较好的办法。

如果一定要用正则的话你可以考虑采用遍历的方式，也就是匹配所有不含abc的情况。

比如说^a, ^b, ^c, ab^c, a^bc....等等等等。不过这样以来正则表达式会显得过于复杂，而且扩展行几乎为0。

如果可以不用正则，那python本身的库就能够实现（可能你嫌处理语句过多或考虑到时间问题而不想用），而且逻辑也较为简单（我觉得是这样）。python的string类中自带有find()和rfind()方法再加上split()方法，合理使用的话应该能找出所有的匹配子字符串。

求python收集微信聊天记录代码每天收集同事们通过微信向我汇报工作情况，汇总成excel表格

我简直收集微信聊天记录代码，每天收集同事们通过微信向我汇报工作情况汇报成变成了exe，表示这个肯定可以，你可以通过聊天记录把它通过电脑来配置，通过他的转接方式都变成哇

python 能抓去微信的聊天记录吗

1. 微信把一个人删除以后，只要对方未删除对方手机聊天记录，对方还能看见我们之前的聊天记录。 2. 微信删除好友是单向的行为，删除好友，你仍会在对方好友列表存在，除非对方主动删除。 3. 删除好友后，对方将从你好友列表删除，你和对方聊天即...

可以用python爬我的微信聊天记录吗

理论上是可以的，因为这个系统的话主要就是用来采取一些网络的信息，只要是通过互联网来传输储存的正常情况都是可以爬取到的，但是需要一定的编程能力才行。

python整理聊天记录设置Tag是个好习惯

评论列表

黑客技术 发布于 2022-05-31 15:33:16

中恢复”，点击即可。第三，此时你可以看到软件正在扫描手机数据，等待扫描完成即可。第四，扫描完成后，可以看到界面上有“微信”、“短信”等栏目显示，点击“微信”即可恢复微信的内容。最回复

发表评论:

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

日历

« 2023年10月 »
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

文章归档

标签列表

阿里旺旺导入聊天记录 (2) 王者荣耀ios和安卓 (2) 王者荣耀安装升级失败 (2) 王者荣耀ios手柄 (2) 王者荣耀英雄搭配 (2) 王者荣耀如何快速获得铭文 (2) 王者荣耀双倍金币卡 (2) 王者荣耀赵云厉害吗 (2) 王者荣耀裴晓峰爱奇艺 (2) 王者荣耀李白铭文4级 (2) 王者荣耀老夫子杨戬 (2) 苹果王者荣耀定制机 (2) 王者荣耀程咬金单挑 (2) 王者荣耀信誉7级怎么加入鹰眼 (2) 王者荣耀称号更新时间 (2) 王者荣耀出心愿点是什么意思 (2) 王者荣耀简单上手法师 (2) 王者荣耀凯皮肤返场什么时候出 (2) 王者荣耀海报英雄妲己 (2) 王者荣耀亚瑟王什么梗 (2) 王者荣耀黄忠lol (2) 红米note4玩王者荣耀发热 (2) 王者荣耀最新五圣兽 (2) 王者荣耀lol英雄对应 (3) 仲裁时聊天记录 (4)