lixiaofei123 8483bef288 Update main.go
解决压缩下载文件是txt的bug
2023-03-02 17:48:51 +08:00
2021-09-16 21:55:36 +08:00
2021-09-16 22:56:27 +08:00
2021-09-16 22:56:27 +08:00
2021-09-16 21:55:36 +08:00
2021-11-19 16:55:00 +08:00
2021-09-16 21:55:36 +08:00
2021-09-16 21:55:36 +08:00
2021-09-16 21:55:36 +08:00
2021-09-16 22:56:27 +08:00
2023-03-02 17:48:51 +08:00
2021-09-16 22:56:27 +08:00
2021-09-16 21:55:36 +08:00

docker build

一个简单的在线pdf工具箱

本项目基于GhostScript进行开发,目前支持PDF压缩以及PDF文字提取(OCR)

PDF文字提取目前支持的语言有 英文、简体中文、繁体中文、日文、韩文

使用方法

使用Docker部署

建议使用Docker一键部署

安装步骤

mkdir -p /data/pdftoolbox/input
mkdir -p /data/pdftoolbox/output
docker run -d --name pdftoolbox --restart=always -p 8082:8082 -v /data/pdftoolbox/input:/opt/pdftoolbox/input  -v /data/pdftoolbox/output:/opt/pdftoolbox/output  mrlee326/pdftoolbox

启动成功后,在浏览器中访问 http://ip:8082如下图所示

pdf工具箱首页

选择上方的【pdf压缩】然后点击【点击此处上传】按钮选择要转换的文件即可上传并压缩。目前支持三种压缩质量

  • 高质量 (300dpi)
  • 中质量 (150dpi)
  • 低质量 (72dpi)

如下图所示

压缩pdf

选择上方的【pdf压缩】然后点击【点击此处上传】按钮选择要转换的文件即可上传并进行OCR文字提取。目前导出格式为txt。此过程会比较慢请耐心等待。等待完毕后即可下载。

OCR文字提取

识别结果如下图所示:

OCR文字提取结果

在Linux上部署

请参考Dockerfile文件

Description
No description provided
Readme 18 MiB
Languages
JavaScript 39.1%
Go 32.1%
CSS 13.2%
HTML 9.5%
Dockerfile 6.1%