python如何导出微信公众号文章方法详解

1.安装wkhtmltopdf

下载地址:https://wkhtmltopdf.org/downloads.html

我测试用的是windows的，下载安装后结果如下

python如何导出微信公众号文章方法详解

2 编写python 代码导出微信公众号文章

不能直接使用wkhtmltopdf 导出微信公众号文章，导出的文章会缺失图片，所以需要使用 wechatsogou 将微信公众号文章页面抓取，之后将html文本转化为pdf

									pip install wechatsogou --upgrade

									pip install pdfkit

踩坑！！！，看了很多人的代码，都是一个模板，大家都是抄来抄去，结果还是运行不了，可能是因为依赖包更新的原因，也可能是因为我本地没有配置wkhtmltopdf 的环境变量

									import os

									import pdfkit

									import datetime

									import wechatsogou

									# 初始化API

									ws_api = wechatsogou.WechatSogouAPI(captcha_break_time=3)

									def url2pdf(url, title, targetPath):

									 '''

									 使用pdfkit生成pdf文件

									 :param url: 文章url

									 :param title: 文章标题

									 :param targetPath: 存储pdf文件的路径

									 '''

									 try:

									 content_info = ws_api.get_article_content(url)

									 except:

									 return False

									 # 处理后的html

									 html = f'''

									{title}

									 {content_info['content_html']}

									 '''

									 try:

									 path_wk="E:/softwareAPP/wkhtmltopdf/bin/wkhtmltopdf.exe";

									 config=pdfkit.configuration(wkhtmltopdf=path_wk)

									 pdfkit.from_string(input=html, output_path=targetPath,configuration=config)

									 except:

									 # 部分文章标题含特殊字符，不能作为文件名

									 filename = datetime.datetime.now().strftime('%Y%m%d%H%M%S') + '.pdf'

									 pdfkit.from_string(html, targetPath + os.path.sep + filename)

									if __name__ == '__main__':

									 # 此处为要爬取公众号的名称

									 url2pdf("https://mp.weixin.qq.com/s/wwT5n2JwEEAkrrmOhedziw", "HBase的系统架构全视角解读","G:/test/hbase文档.pdf" )

									 # gzh_name = ''

									 # # 如果不存在目标文件夹就进行创建

									 # if not os.path.exists(targetPath):

									 # os.makedirs(targetPath)

									 # # 将该公众号最近10篇文章信息以字典形式返回

									 # data = ws_api.get_gzh_article_by_history(gzh_name)

									 # article_list = data['article']

									 # for article in article_list:

									 # url = article['content_url']

									 # id="codetool">

到此这篇关于python如何导出微信公众号文章方法详解的文章就介绍到这了,更多相关python导出微信公众号文章内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://www.php.cn/python-tutorials-459324.html

Python

导出

微信公众号文章

延伸 · 阅读

精彩推荐

Python

Python中使用copy模块实现列表(list)拷贝

这篇文章主要介绍了Python中使用copy模块实现列表(list)拷贝,本文讲解了简单列表的复制和复杂列表复制的解决方法,需要的朋友可以参考下 ...

脚本之家5502020-06-05
Python

Python标准库之随机数 (math包、random包)介绍

这篇文章主要介绍了Python标准库之随机数 (math包、random包)介绍,本文讲解了math包的常用函数,同时给出了random包的使用例子,需要的朋友可以参考下 ...

脚本之家4212020-05-15
Python

Python中的两个内置模块介绍

这篇文章主要介绍了Python中的两个内置模块介绍,本文讲解Python启动后默认会加载的两个内建模块,需要的朋友可以参考下 ...

脚本之家4172020-05-30
Python

Python3指定路径寻找符合匹配模式文件

这篇文章主要介绍了Python3指定路径寻找符合匹配模式文件,涉及Python文件查找与模式匹配的相关技巧,需要的朋友可以参考下 ...

work244202020-07-05
Python

Python中处理字符串之isalpha()方法的使用

这篇文章主要介绍了Python中处理字符串之isalpha()方法的使用,是Python入门学习中的基础知识,需要的朋友可以参考下 ...

脚本之家3512020-07-01
Python

Python计算机视觉里的IOU计算实例

今天小编就为大家分享一篇Python计算机视觉里的IOU计算实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧 ...

GAN_player2082020-04-17
Python

Python作用域用法实例详解

这篇文章主要介绍了Python作用域用法,结合实例形式详细分析了Python作用域概念,用法与相关函数的使用技巧,需要的朋友可以参考下...

小谈博客4092020-08-16
Python

在Python中用keys()方法返回字典键的教程

这篇文章主要介绍了在Python中用keys()方法返回字典键的教程,是Python入门中的基础知识,需要的朋友可以参考下 ...

Python教程网3922020-07-05

秒客网

python如何导出微信公众号文章方法详解

延伸 · 阅读

Python中使用copy模块实现列表(list)拷贝

Python标准库之随机数 (math包、random包)介绍

Python中的两个内置模块介绍

Python3指定路径寻找符合匹配模式文件

Python中处理字符串之isalpha()方法的使用

Python计算机视觉里的IOU计算实例

Python作用域用法实例详解

在Python中用keys()方法返回字典键的教程

使用Python抓取模板之家的CSS模板

Python 列表(List)操作方法详解

相关文章