OCRmyPDF GUI

OCRmyPDF-GUI是一个图形用户界面，让OCRmyPDF命令行工具的强大功能变得简单易用。通过直观的界面，您可以为扫描的PDF文件添加文本层，使其可搜索和可复制粘贴，而无需记忆复杂的命令行参数。

主要特点

简洁直观的图形界面：无需命令行知识，即可使用OCRmyPDF的全部功能
批量处理：一次处理多个PDF文件，并显示详细进度
拖放支持：直接拖放文件到程序窗口
多语言OCR支持：支持100多种语言的文本识别
智能文件命名：支持多种输出文件命名选项，包括自定义前缀
高级OCR选项：自动校正倾斜页面、自动旋转、清理图像等
配置管理：保存和加载常用OCR配置
详细状态反馈：提供处理状态和结果的清晰反馈

功能演示

OCRmyPDF-GUI提供以下功能：

✓ 添加OCR文本层到PDF文件
✓ 处理单个或批量PDF文件
✓ 多语言文档识别
✓ 自动校正倾斜页面
✓ 自动旋转页面
✓ 优化输出文件大小
✓ 自定义输出文件命名
✓ 保存常用处理配置

安装要求

Python 3.7+
OCRmyPDF
Tesseract OCR
PySide6 (Qt for Python)

安装步骤

1. 安装OCRmyPDF和其依赖

# macOS
brew install ocrmypdf

# Ubuntu/Debian
sudo apt install ocrmypdf

# Fedora
sudo dnf install ocrmypdf

# Windows (WSL)
sudo apt install ocrmypdf

# 或使用pip
pip install ocrmypdf

2. 安装GUI依赖

pip install PySide6

3. 克隆本仓库

git clone https://github.com/yourusername/OCRmyPDF-GUI.git
cd OCRmyPDF-GUI

4. 运行应用程序

python run.py

安装Tesseract语言包

默认情况下，OCRmyPDF只安装英语语言包。要使用其他语言进行OCR，需要安装额外的语言包：

macOS

# 安装所有语言包
brew install tesseract-lang

# 或者手动安装特定语言包
# 1. 下载语言包文件，例如简体中文：
# https://github.com/tesseract-ocr/tessdata/raw/main/chi_sim.traineddata
# 2. 复制到Tesseract的tessdata目录：
# sudo cp chi_sim.traineddata /opt/homebrew/share/tessdata/
# 或
# sudo cp chi_sim.traineddata /usr/local/share/tessdata/

Ubuntu/Debian

# 安装特定语言包，例如简体中文：
sudo apt-get install tesseract-ocr-chi-sim

# 查看所有可用语言包：
apt-cache search tesseract-ocr

Fedora

# 安装特定语言包，例如简体中文：
sudo dnf install tesseract-langpack-chi_sim

# 查看所有可用语言包：
dnf search tesseract

Windows

从以下网址下载所需语言包文件： https://github.com/tesseract-ocr/tessdata/
将下载的.traineddata文件放置在Tesseract安装目录的tessdata文件夹中，通常位于： C:\Program Files\Tesseract-OCR\tessdata

常用语言代码

eng - 英语
chi_sim - 简体中文
chi_tra - 繁体中文
jpn - 日语
kor - 韩语
fra - 法语
deu - 德语
rus - 俄语
spa - 西班牙语
ita - 意大利语

更多信息请参考：OCRmyPDF语言包文档

项目结构

OCRmyPDF-GUI/
├── src/                      # 源代码
│   ├── core/                 # 核心功能
│   │   ├── config.py         # 配置管理
│   │   └── ocr_engine.py     # OCR引擎封装
│   ├── gui/                  # 图形界面
│   │   ├── main_window.py    # 主窗口
│   │   ├── batch_dialog.py   # 批量处理对话框
│   │   └── settings.py       # 设置对话框
│   └── utils/                # 工具函数
│       └── file_utils.py     # 文件操作工具
├── run.py                    # 启动脚本
└── README.md                 # 项目说明

开发计划

贡献指南

我们欢迎并感谢所有形式的贡献！以下是一些参与项目的方式：

提交问题和建议：如果您发现bug或有改进建议，请创建issue。
提交代码：
- Fork 这个仓库
- 创建您的特性分支 (git checkout -b feature/amazing-feature)
- 提交您的更改 (git commit -m 'Add some amazing feature')
- 推送到分支 (git push origin feature/amazing-feature)
- 开启一个Pull Request
改进文档：帮助我们完善文档，包括README、安装说明或用户指南。

请确保您的代码符合项目的代码风格，并添加适当的测试。

关于OCRmyPDF

本项目是OCRmyPDF命令行工具的图形界面封装。OCRmyPDF是一个强大的工具，可以为扫描的PDF文件添加OCR文本层，使其可搜索和可复制粘贴。OCRmyPDF-GUI旨在让更多不熟悉命令行的用户能够轻松使用OCRmyPDF的强大功能。

许可证

本项目采用Mozilla Public License 2.0 (MPL-2.0)许可证，与OCRmyPDF原项目保持一致。

致谢

OCRmyPDF - 强大的OCR工具
Tesseract OCR - OCR引擎
Qt for Python (PySide6) - GUI框架

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.idea		.idea
docs/images		docs/images
src		src
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

OCRmyPDF GUI

主要特点

功能演示

安装要求

安装步骤

1. 安装OCRmyPDF和其依赖

2. 安装GUI依赖

3. 克隆本仓库

4. 运行应用程序

安装Tesseract语言包

macOS

Ubuntu/Debian

Fedora

Windows

常用语言代码

项目结构

开发计划

贡献指南

关于OCRmyPDF

许可证

致谢

About

Uh oh!

Releases

Packages

Languages

License

denovochen/OCRmyPDF-GUI

Folders and files

Latest commit

History

Repository files navigation

OCRmyPDF GUI

主要特点

功能演示

安装要求

安装步骤

1. 安装OCRmyPDF和其依赖

2. 安装GUI依赖

3. 克隆本仓库

4. 运行应用程序

安装Tesseract语言包

macOS

Ubuntu/Debian

Fedora

Windows

常用语言代码

项目结构

开发计划

贡献指南

关于OCRmyPDF

许可证

致谢

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages