黑客接单网_黑客接单网-专注黑客技术黑客接单网_黑客接单网-专注黑客技术

国内首家实力在线黑客网

python整理聊天记录(Python爬虫好友聊天记录)

本文导读目录:

微信聊天记录使用python爬虫到底能采集吗

首先,下载互盾苹果恢复大师,先安装好备用。

第二,打开“互盾苹果恢复大师”软件,看到界面上“从iTunes备份文件中恢复”,点击即可。

第三,此时你可以看到软件正在扫描手机数据,等待扫描完成即可。

第四,扫描完成后,可以看到界面上有“微信”、“短信”等栏目显示,点击“微信”即可恢复微信的内容。

最后,点击“微信”后可以在右侧直接看到内容,也可以选择“导出”。

python将微信聊天内容复制到word文档?

python 有一个第三方库 pywx 你可以去看看,了解一下,然后匹配特定聊天记录的话可以试着用正则试试

望采纳

python能看微信记录吗

导出微信聊天db文件

手机端导出

发现现在的Android手机都很难root,而db文件肯定在微信的应用目录下。拿不出来的。

电脑端导出(mac)

从~/Library/Containers/com.tencent.xinWeChat/Data/Library/Application\ Support/com.tencent.xinWeChat下找到对应账号的数据存储目录。

屏幕快照 2019-10-17 下午5.46.38.png

Message

存储聊天消息

Contact

存储联系人信息

获取db密钥

打开微信

命令行运行 lldb -p $(pgrep WeChat)

在 lldb 中输入 br set -n sqlite3_key, 回车

还是在 lldb 中,输入 c, 回车

扫码登录微信

这时候回到 lldb 界面, 输入 memory read --size 1 --format x --count 32 $rsi, 回车

命令行回显结果

0x000000000000: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

0x000000000008: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

0x000000000010: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

0x000000000018: 0xab 0xcd 0xef 0xab 0xcd 0xef 0xab 0xcd

忽略左边的地址( 0x000000000000: ,0x000000000008:),从左到右,从上到下,把形如 0xab 0xcd 的数据拼起来,然后去掉所有的 "0x"和空格、换行, 得到 64 个字符的字符串,这就是 微信数据库的 key

可以遇到的问题(来自网上,我在使用过程中没有这个问题))

*.db 文件要在另一台 PC 或 Mac 上 登录微信, 才能被关闭,否则里面的聊天记录不是最新的;当然也可以强制调用 wal_checkpoint, 不过作为土办法,在另一台电脑上登一下微信也无妨。

那么wal_checkpoint是什么?是一个sqlite命令,可以参考:https://www.sqlite.org/pragma.html#pragma_wal_checkpoint,如果不想看英文,那就百度一下吧!

db browser for sqlite

db数据库可视化工具,打开需要查看的数据库文件:

屏幕快照 2019-10-17 下午6.43.43.png

先输入0x,然后把上面得到的密钥复制进来。由于编码的问题,可能复制进来会出现打不开的情况,你可以先把密钥复制到软件执行sql语句的地方,然后在复制。一会python读取db数据库会参考上面的设置参数。

python解密db数据库

这里需要使用sqlite来操作数据库,而sqlite本身是不支持加密和解密的,那么这部分就需要我们自己来完成,但是网上已经有开源库了。

使用到的python库

加密解密db库——pysqlcipher3。

加密算法库——sqlcipher。

微信db加密库——wcdb

参考文档

https://docs.python.org/2/library/sqlite3.html#cursor-objects

https://docs.python.org/2/library/sqlite3.html#cursor-objects

db解密

路径配置

# 加密DB文件绝对路径,微信DB加密方案参考:    https://github.com/Tencent/wcdb

DB_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/encryption/'

# 解密后生成不加密DB文件绝对路径

DB_OUT_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/decrypt/'

DB_OUT_JSON_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/json/'

DB_ROOT_PATH = '/Users/pengdaosong/pds/python/PythonStudy/db/'

# 解密数据库key

DB_KEY = "x''1133d3dd61764a9e80699b42b61e443515aeb00cf4f5497d9729adcb6c8e78e2''"

# 新的DB加密数据KEY,如果为空,者不加密

DB_NEW_KEY = ''

这里说一下DB_KEY的写法,官网写法是这样的:"x'2DD29CA851E7B56E4697B0E1F08507293D761A05CE4D1B628663F411A8086D99'";但是这样写始终是不能打开数据库的,始终报“不是一个数据库文件”。换成上面的写法后可以打开。所以,这里如果不能打开,把这两种写都试一试。像在密钥前加'0x'等都可以试一试。

解密

import pysqlcipher3.dbapi2 as sqliteimport config as cfdef decrypt(path, fileName):

   # ———————————————————————————————————数据库操作———————————————————————————————————

   # 参考:https://www.sqlite.org/pragma.html#pragma_wal_checkpoint

   # 连接数据库如果文件不存在,会自动在当前目录创建:

   db = sqlite.connect(path + fileName)

   # 创建一个Cursor:

   db_cursor = db.cursor()

   # ————————————————————————————————————解密数据DB———————————————————————————————————

   # sqlcipher加密解密参考:https://github.com/sqlcipher/android-database-sqlcipher/issues/94

   # sqlcipher开源库地址:https://github.com/sqlcipher/sqlcipher/issues

   # sqlcipherApi:https://www.zetetic.net/sqlcipher/sqlcipher-api/

   db_cursor.execute("PRAGMA key='" + cf.DB_KEY + "';")

   db_cursor.execute("PRAGMA cipher_compatibility=3;")

   db_cursor.execute("PRAGMA cipher_page_size=1024;")

   db_cursor.execute("PRAGMA kdf_iter=64000;")

   db_cursor.execute("PRAGMA cipher_hmac_algorithm=HMAC_SHA1;")

   db_cursor.execute("PRAGMA cipher_kdf_algorithm=PBKDF2_HMAC_SHA1;")

   # 将解密文件导入新的DB文件

   decrypt = cf.DB_OUT_PATH + 'decrypt_' + fileName

   db_cursor.execute("ATTACH DATABASE '" + decrypt + "' AS db_de KEY '" + cf.DB_NEW_KEY + "';  -- empty key will disable encryption")

   db_cursor.execute("SELECT sqlcipher_export('db_de');")

   db_cursor.execute("DETACH DATABASE db_de;")

   db_cursor.close()

更多加密参数设置参考:sqlcipher使用文档

将数据库导出为json

import pysqlcipher3.dbapi2 as sqliteimport config as cf_wximport dbToJsondef parse(path, fileName):

   db = sqlite.connect(path + fileName)

   db_cursor = db.cursor()

   all_table = db_cursor.execute("SELECT name FROM sqlite_master WHERE type = 'table';").fetchall()

   print(all_table)

   for x in all_table:

       table_name = x[0]

       print("Searching", table_name)

       try:

           t = db_cursor.execute('SELECT * FROM ' + table_name + ';')

           dbToJson.tableToFile(db_cursor,table_name)  

           print('\n')

       except BaseException as e:

           print(e)

           continue

   db_cursor.close()

   db.close()

import jsonimport numpy as npimport config as cf_wxclass MyEncoder(json.JSONEncoder):

 def default(self, obj):

     if isinstance(obj, np.ndarray):

         return obj.tolist()

     elif isinstance(obj, bytes):

         # utf-8会报错:'utf-8' codec can't decode byte 0xfc in position 14: invalid start byte

         return str(obj, encoding='ISO-8859-15')

     return json.JSONEncoder.default(self, obj)def tableToJson(cursor, table):

 query = 'SELECT * FROM ' + table

 rows = cursor.execute(query)

 items = []

 for row in rows:

     item = {}

     for key in cursor.description:

         item.update({key[0]: value for value in row})

     items.append(item)

 # 注意不要写道for里面了,不然数据结果不对    

 js = json.dumps(items, ensure_ascii=False, cls=MyEncoder, indent=4)

 print(js)

 print('--------------------------------')def tableToFile(cursor, table):

 query = 'SELECT * FROM ' + table

 rows = cursor.execute(query)

 items = []

 for row in rows:

     item = {}

     # 参考:https://stackoverflow.com/questions/3300464/how-can-i-get-dict-from-sqlite-query

     for idx, col in enumerate(cursor.description):

         value = row[idx]

         item.update({col[0]: value})

     items.append(item)

 # 注意不要写道for里面了,不然数据结果不对

 json_name = ""

 if(table.endswith('.db')):

     json_name = table[:(table.__len__ - 3)]

 else:

     json_name = table  file = open(cf_wx.DB_OUT_JSON_PATH + json_name + ".json", 'w+')

 # ensure_ascii默认为True,汉字会被编码成'\u4e00\u6839\u806a'

 js = json.dumps(items, ensure_ascii=False, cls=MyEncoder, indent=4)

 file.write(js)

 file.close()

关联

查看聊天消息数据发现,不能把聊天消息数据表和对应的聊天人对应起来,因为消息表并没有存是和谁在聊天。如果不能和对应的人联系起来,岂不是感觉很不好。那这里就要用到联系人数据库了,密钥和上面的一样。打开联系人的数据查看:

屏幕快照 2019-10-17 下午7.30.41.png

这是其中一个联系人,将"m_nsUsrName"进行32 MD5后得到32为字符串。在者字符串前面加上"Chat_"就是这个联系人在消息数据库里面对应的表名。这样就可以通过这个字符串在消息数据库里找到对应的聊天消息了。

python 正则表达式 匹配多行聊天记录的问题。

如果你所指得[任意文字]的意思是1个或1个以上文字得话

你可以试试下面得语句

p = re.compile(u'.*想知道.+\n.+也想知道.+')

否则你只需要将里面得"+"改为"*"就可以匹配0得情况

也就是下面得语句

p = re.compile(u'.*想知道.*\n.*也想知道.*')

测试代码如下:

a = u"""我想知道。

..... 我也想知道。"""

p.search(a)

_sre.SRE_Match object at 0x1014d5100

看了你的问题补充,如果你想要查找出字符串中最后匹配的子字符串的话,我目前没想到比较好的办法。

如果一定要用正则的话你可以考虑采用遍历的方式,也就是匹配所有不含abc的情况。

比如说^a, ^b, ^c, ab^c, a^bc....等等等等。不过这样以来正则表达式会显得过于复杂,而且扩展行几乎为0。

如果可以不用正则,那python本身的库就能够实现(可能你嫌处理语句过多或考虑到时间问题而不想用),而且逻辑也较为简单(我觉得是这样)。python的string类中自带有find()和rfind()方法再加上split()方法,合理使用的话应该能找出所有的匹配子字符串。

求python收集微信聊天记录代码 每天收集同事们通过微信向我汇报工作情况,汇总成excel表格

我简直收集微信聊天记录代码,每天收集同事们通过微信向我汇报工作情况汇报成变成了exe,表示这个肯定可以,你可以通过聊天记录把它通过电脑来配置,通过他的转接方式都变成哇

python 能抓去微信的聊天记录吗

1. 微信把一个人删除以后,只要对方未删除对方手机聊天记录,对方还能看见我们之前的聊天记录。 2. 微信删除好友是单向的行为,删除好友,你仍会在对方好友列表存在,除非对方主动删除。 3. 删除好友后,对方将从你好友列表删除,你和对方聊天即...

可以用python爬我的微信聊天记录吗

理论上是可以的,因为这个系统的话主要就是用来采取一些网络的信息,只要是通过互联网来传输储存的正常情况都是可以爬取到的,但是需要一定的编程能力才行。

相关文章

评论列表

黑客技术

黑客技术 发布于 2022-05-31 15:33:16  

中恢复”,点击即可。第三,此时你可以看到软件正在扫描手机数据,等待扫描完成即可。第四,扫描完成后,可以看到界面上有“微信”、“短信”等栏目显示,点击“微信”即可恢复微信的内容。最 回复
发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。