WeChat Article一款利用Python爬虫写的免费开源爬取微信公众号文章工具,能够批量爬取微信公众号文章,可以把内容下载到本地保存为HTML,而且支持断点续传,工具原理是通过selenium登录获取token和cookie,再自动爬取和下载,不过工具非开箱即用的,不过作者由演示视频,感兴趣的同学可以学习研究一下。
爬取微信公众号文章
Bilibili视频演示:https://www.bilibili.com/video/BV1vN411D7Y3/
注意,除非你要断点续传,否则删除目录下conf.ini和url.json再启动!!!!
使用方法:
1、下载并解压Chrome.rar;
2、运行main.exe;
3、填入信息,点击“启动”即可。
背景知识:
爬取微信公众号有三种方法:
- 第一种:用搜狗微信公众号搜过,这个只能收到前10条;
- 第二种:用fiddler或手机抓包,从访问链接去获得appmsg_token,发现虽然这个值就在html页面里,但只有抓包的数据里含有效值,直接访问的是空的,而且还有时效性。这样,每次都要抓包获取,就很麻烦。
- 第三种:就是这种用公众号搜公众号的,虽然速度慢点,但便捷了不少。