python将pdf文件转换成word文档,python将网页保存为pdf

  python将pdf文件转换成word文档,python将网页保存为pdf

  Kit是一个把HTML CSS格式的文件转换成PDF的工具,是wkhtmltopdf的python包。在本文中,我们将使用pdfkit来实现网页内容到PDF文档和图片的转换。有兴趣的可以了解一下。

  00-1010 1、简介2、代码练习2.1模块简介2.2安装2.3代码示例2.4扩展3、总结

  

目录

  鱼:屌丝,你在干嘛?

  屌丝:我女神要这个网页的内容。

  鱼:那你就不能复制粘贴这一点点。

  屌丝:为了我的女神,我会努力…

  鱼:我们能成为人吗?顺着网页内容往下爬就行了。

  屌丝:我女神也会把这些内容转换成PDF。

  鱼:关于你的女神有太多的事情了…

  屌丝:鱼哥,你有什么好主意吗?

  鱼:嗯,有一个办法。

  屌丝:我知道。

  小雨:你愿意为你的女神做任何事,所以我会毫不犹豫的直接上教程。

  

1、引言

  关于将网页内容转换成PDF,通常的想法是:

  可以实现抓取网页内容保存到本地转换成PDF文档的方法,但是很麻烦,需要两次传输。

  今天小宇分享的方法只是三行代码,一次就可以搞定。

  

2、代码实战

  2.1.1 pdfkit

  Kit是一个把HTML CSS格式的文件转换成PDF的工具,是wkhtmltopdf的python包。

  

2.1 模块介绍

  pip安装pdf包

  其他安装方法请直接参考这两篇文章:

  《Python3自动安装第三方库,跟pip说再见》

  《Python:一行代码,导入Python所有库》

  敲黑板:

  Kit是基于WKMLTOPDF的一个包,所以需要先安装WKMLTOPDF。

  Wkhtmltopdf官网

  

2.2 安装

  2.3.1 URL 对应网页转 PDF

  代码示例:

  # -*-编码:utf-8 -*-

  # @时间: 2022-06-12

  # @作者:卡尔_DJ

  导入pdfkit

   URL对应网页到PDF

  #wkhtmltopdf.exe是本地安装的路径。

  config=pdf kit . configuration(wkhtmltopdf=r d : \ program files \ wkhtmltopdf \ bin \ wkhtmltopdf . exe )

  #调用PDFkit.from_url参数来转换pdf

  pdf kit . from _ URL(r https://blog . csdn . net/wuyoudeyuer?Type=blog , Carl_ yiran.pdf ,configuration=config)

  运行结果:

  2.3.2 HTML 文件转 PDF

  代码示例:

  # -*-编码:utf-8 -*-

  # @时间: 2022-06-12

  # @作者:卡尔_DJ

  导入pdfkit

   HTML文件到PDF

  config=pdf kit . configuration(wkhtmltopdf=r d : \ program files \ wkhtmltopdf \ bin \ wkhtmltopdf . exe )

  #调用PDFkit.from_file参数转换pdf

  pdf . from _ file(r d : \ Carl _ yiran的博客. h

  tml, Carl_奕然.pdf, configuration=config)

  

  敲黑板

  读取html,需要调用pdfkit.from_file 参数。

  2.3.3 字符串转 PDF

  代码示例:

  

# -*- coding:utf-8 -*-

  # @Time : 2022-06-12

  # @Author : carl_DJ

  import pdfkit

  字符串转 PDF

  config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")

  #调用pdfkit.from_file参数,转换PDF

  pdfkit.from_string(rIlike wangxinling, Carl_奕然.pdf, configuration=config)

  

  运行结果

  

  

  

2.4 拓展

  小屌丝:鱼哥,如果我不想写代码,能不能一键转换成PDF呢?

  小鱼:嗯,这个可以实现,但是不能一键,必须一行代码。

  小屌丝:也行,能少些一行是一行。

  2.4.1 网页转换PDF

  开篇小鱼也说过:pdfkit 是基于 wkhtmltopdf 的封装,所以功能肯定也是基于 wkhtmltopdf 的。

  于是乎,我们就能先到,直接用wkhtmltopdf 的功能,看看能否实现PDF转换。

  代码示例

  第一步、找到wkhtmltopdf的安装路径,以小鱼的为例:

  D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe

  第二步、powershell打开,输入命令

  .\wkhtmltopdf.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.pdf

  运行结果

  

  解析

  

  • .\wkhtmltopdf.exe :调用wkhtmltopdf.exe
  • https://blog.csdn.net/wuyoudeyuer?type=blog:url地址
  • D:\carl.pdf:保存的路径

  2.4.2 网页转换图片

  代码示例

  我们来试一下网页转换成图片,

  同样,

  第一步、打开powershell,进入到bin文件夹下

  第二步、输入命令:.\wkhtmltoimage.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.png

  运行结果

  

  

  

3、总结

  今天的分享,就到这里了。

  是不是奇奇怪怪的姿势,又增加了呢。

  我们总结一下今天的内容:

  pdfkit 可以可以实现的转换:

  

  • URL 对应网页转 PDF
  • html文件转 PDF
  • 字符串转 PDF

  wkhtmltopdf.exe可以实现的转换:

  

  • 网页转图片
  • 网页转 PDF

  到此这篇关于Python3实现网页内容转换成PDF文档和图片的文章就介绍到这了,更多相关Python网页内容转PDF 图片内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • 怎么在word中下载mathtype,word中怎么导入mathtype
  • php生成word文档的三种实现方式是什么,php 生成word
  • php生成word文档的三种实现方式是什么,php 生成word,PHP生成word文档的三种实现方式
  • IceSword,ice of swords
  • IceSword,ice of swords,IceSword (冰刃) 应用图文指南
  • 基于wordpress的博客建设,如何使用wordpress建站
  • ,,WordPress中设置Post Type自定义文章类型的实例教程
  • ,,MYSQL安装时解决要输入current root password的解决方法
  • 学生成绩管理系统c语言课程设计报告,学生成绩管理系统c语言程序设计,C语言学生成绩管理系统课程设计word版
  • 如何用python把pdf转为word,Python转PDF
  • word365怎么转pdf,office365word怎么转换pdf_1
  • Word文档图片不显示,Word文档的图片无法显示出来
  • 如何将多个wps文件合并成一个,WPS多个word文档合并成一个文档
  • wpsword怎么取消首字母大写,wps word取消首字母大写
  • 如何word文档删除空白页,怎样在word文档删除空白页
  • 留言与评论(共有 条评论)
       
    验证码: