2 Star 9 Fork 5

黄朝勋 / PDF工具合集

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README.md 5.01 KB
一键复制 编辑 原始数据 按行查看 历史

PDF工具合集

date:2022.10.19
update time: 2023.05.05
name:PDF工具合集
make:黄朝勋

介绍

PDF工具合集:

—V2.9:全新UI设计,全面支持windows、linux、Mac操作系统,
—V2.8:新增PDF添加水印功能、图片高级压缩功能,PDF转PPT功能
—V2.7:增加PDF合并功能,选择指定的文件夹,将文件夹内所有PDF合并为一个PDF文件
—V2.6:重大更新新增OCR功能。已实现PDF转图片功能,word转PDF功能,PDF转word功能,PDF文件压缩功能(可将大文件压缩成同分辨率的小文件,优化pdf文件)、照片修复功能、图片内容转word功能、PDF文件转可编辑的Word功能。

预览

安装环境要求:
   - 操作系统:Windows 11 
   - IDE编辑器:PyCharm 2022.1 (支持其他编译器)
   - 开发软件:python:3.8.5 (大于3.7版本,推荐3.8.5此版本,不能高于3.10版本)
   - 开发框架:Microsoft C++ 生成工具
   - 下载地址:https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

输入图片说明

安装依赖库
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
如安装失败,请单独安装下列缺少的依赖库
pip install PyMuPDf==1.19.0 -i https://mirrors.aliyun.com/pypi/simple
pip install PyWin32 -i https://mirrors.aliyun.com/pypi/simple
pip install pyinstaller -i https://mirrors.aliyun.com/pypi/simple
pip install pdf2docx -i https://mirrors.aliyun.com/pypi/simple
pip install ttkbootstrap -i https://mirrors.aliyun.com/pypi/simple
pip install PyPDF2 -i https://mirrors.aliyun.com/pypi/simple
pip install comtypes -i https://mirrors.aliyun.com/pypi/simple
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install paddlepaddle==2.3.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install "paddleocr>=2.6.0.3" -i https://pypi.tuna.tsinghua.edu.cn/simple
生成可执行文件命令:pyinstaller -D -w -i favicon.ico PDFmake.py
打包命令:

pyinstaller .\PDFmake.py --add-data="venv/Lib/site-packages/paddle/fluid/proto;paddle/fluid/proto" --add-data="venv/Lib/site-packages/paddleocr/ppocr;ppocr" --add-binary="venv/Lib/site-packages/paddle/libs;." --hidden-import="framework_pb2" --hidden-import="scipy.special.cython_special" --hidden-import="skimage" --hidden-import="skimage.feature._orb_descriptor_positions" --hidden-import="skimage.filters.edges" -p="venv/Lib/site-packages/paddleocr;venv/Lib/site-packages/paddle/libs;.paddleocr" -D -w -i favicon.ico

注:打包前必须设置项 1、:更改paddle下面dataset里面的image.py,如我的路径为:D:\PDFmake\venv\Lib\site-packages\paddle\dataset\image.py
   import_cv2_proc = subprocess.Popen(
        [interpreter, "-c", "import cv2"],
        stdout=subprocess.PIPE,
        stderr=subprocess.PIPE,
        shell= True)

修改说明

改为:
 import_cv2_proc = subprocess.Popen(
        [interpreter, "-c", "import cv2"],
        stdin=subprocess.PIPE,
        stdout=subprocess.PIPE,
        stderr=subprocess.PIPE,
        shell= True)
2、必须将.paddleocr文件夹打包,或手动将.paddleocr文件夹复制到打包生成的目录下
3、pyinstaller打包命令报错,请在生成的PDFmake.spec中添加:import sys ; sys.setrecursionlimit(sys.getrecursionlimit() * 5),再用打包命令:pyinstaller PDFmake.spec

二、功能展示

1、图片转Word功能:实现将图片中的文字提取到word中,方便快速编辑文档

图片转Word

2、照片磨皮修复功能:通过双边滤波技术,美化照片、消除斑点、提升照片质量

照片磨皮

3、PDF转图片功能:实现将PDF的每一页存为一张图片,方便工作及日常需要

PDF转图片

4、word转PDF功能:实现word转换为PDF,防止别人二次修改Word文件,亦方便转换为PDF浏览

word转PDF

5、PDF转word功能:此功能为上述功能的逆转功能,在上述转换后,若需转换为word,可使用此功能

PDF转word

6、PDF转可编辑word功能:实现将PDF中的文字提取到word中,无论PDF是由图片组成亦或其他组成都可以提取

PDF转可编辑word

7、图片高级压缩功能,在保留图片质量的前提下,极限压缩图片。

图片高级压缩功能

8、PDF添加水印功能,需要自行用word制作好水印,保存为:水印.pdf,放在程序目录下

PDF添加水印功能

9、PDF转PPT功能(不可编辑)

PDF转PPT功能

三、联系方式:若有实际需求及安装问题,请加微信了解!

微信

四、欢迎你的赞助,你的赞助是我前进的动力

收款

Python
1
https://gitee.com/xiaobuxia/pdfmake.git
git@gitee.com:xiaobuxia/pdfmake.git
xiaobuxia
pdfmake
PDF工具合集
master

搜索帮助