[Github发现] PDFMathTranslate – 完整保留排版的PDF学术论文双语翻译工具

Github发现2026-03-31发布 WarpEdit
10 0 0

阅读英文论文时遇到专业术语卡壳、想快速翻译全文又怕破坏公式和排版——这是每个科研人员都经历过的痛。传统翻译工具要么全文生硬机翻,要么直接把 PDF 里的公式图表弄得面目全非。PDFMathTranslate(项目名 pdf2zh)正是来解决这个问题的:基于 AI 大模型实现 PDF 学术文档的整篇翻译,同时完整保留公式、图表、目录结构、注释等所有排版元素,GitHub 斩获 32,600 颗星,是目前最受欢迎的学术论文翻译开源工具。

PDFMathTranslate 项目截图

相关链接

  • GitHub 仓库:https://github.com/PDFMathTranslate/PDFMathTranslate(32.6k ⭐ | 2.9k Fork)
  • 在线翻译服务:https://pdf2zh.com(免费使用,推荐)
  • Huggingface 在线 Demo:https://huggingface.co/spaces/AI4Chem/pdfmathtranslate
  • ModelScope 在线 Demo:https://modelscope.cn/studios/AI4Chem/pdfmathtranslate
  • Immersive Translate BabelDOC:https://immersivetranslate.com(内置 PDFMathTranslate 支持)
  • 论文:EMNLP 2025 System Demonstrations

PDFMathTranslate 是什么

PDFMathTranslate 由 Ouyang Rongxin、Chu Chang、Xin Zhikuang、Ma Xiangyao 四位研究者开发,核心目标是打破语言壁垒、同时保护学术文档中最重要的视觉结构信息——这是以往翻译工具普遍忽视的部分。

大多数现有翻译工具会把 PDF 当作纯文本来处理,遇到 LaTeX 公式就傻眼,遇到跨栏排版就错乱,遇到图表注释就丢失。PDFMathTranslate 的做法是:先用 DocLayout-YOLO 精确检测页面布局(文字块、公式、图表、目录等各占哪个区域),再借助大语言模型对每个区块分别翻译,最后用 PyMuPDF 将翻译结果重新注入原 PDF,保持原始排版不走样。

该项目被 EMNLP 2025(自然语言处理顶会)录用为 System Demonstrations 论文,学术认可度高,同时作为开源工具已获得超过 22 万次下载。

核心功能

1. 排版元素完整保留

这是 PDFMathTranslate 区别于普通翻译工具的最大亮点。它能够保留:

  • LaTeX 数学公式:包括行内公式和独立显示的复杂公式
  • 图表与图像:图片位置和大小不变
  • 目录结构:自动识别 PDF 书签目录
  • 页眉页脚页码:原样保留
  • 脚注和尾注:保持引用关联
  • 多栏排版:双栏/三栏等学术论文常用排版

输出的翻译文档既可以是双语对照版(原文+译文左右/上下排列),也可以是纯译文版,适应不同阅读需求。

2. 多翻译服务支持

PDFMathTranslate 不绑定某一个翻译 API,支持灵活切换:

服务 说明
Google Translate 默认服务,免费无需配置 API Key
DeepL 高质量翻译,支持中文/英文/日文/韩文等
OpenAI(GPT 系列) 支持自定义模型,翻译质量高
Ollama 本地部署大模型,完全离线可用
MiniMax 国产大模型,2026年3月新增支持

3. 多种使用方式

PDFMathTranslate 提供了丰富的接入方式,满足不同技术水平的用户:

  • 在线服务:直接访问 pdf2zh.com,无需安装任何东西,推荐日常使用
  • 命令行工具:安装后一条命令完成翻译,适合批量处理
  • 图形界面:交互式 GUI,拖拽即可翻译,无需记忆命令
  • Docker 容器:一条命令启动,完全隔离环境
  • Zotero 插件:在 Zotero 文献管理器中直接翻译 PDF
  • MCP 服务:支持 MCP STDIO/SSE 模式,可接入 AI 编码工具

4. 精确模式 v2.0(实验性)

2026 年 3 月,项目引入了实验性的 v2.0 翻译内核(通过 --mode precise 参数启用),采用隔离环境处理,进一步提升了翻译精度和对复杂排版的兼容性。注意 v2.0 仍处于实验阶段,稳定使用建议默认 fast 模式(v1)。

5. 高级参数控制

命令行提供丰富的参数选项:

  • -li:指定源语言(如 -li en
  • -lo:指定目标语言(如 -lo zh
  • -p:仅翻译指定页面(如 -p 1 只翻译第1页)
  • -t:多线程翻译加速
  • -o:指定输出目录
  • --dir:批量翻译整个文件夹
  • --prompt:自定义翻译提示词
  • --share:生成公网分享链接
  • --authorized:设置访问授权白名单

快速部署

方式一:在线使用(最简单)

访问 https://pdf2zh.com,上传 PDF 文件,选择语言,直接下载翻译结果,全程无需安装。

方式二:pip 安装(Python 环境)

Python 版本要求 3.11-3.12:

# 使用 uv 安装(推荐)
pip install uv
uv tool install --python 3.12 pdf2zh

# 或直接用 pip
pip install pdf2zh

# 基本用法
pdf2zh document.pdf

# 指定目标语言为中文
pdf2zh document.pdf -lo zh

# 使用 DeepL 翻译
pdf2zh document.pdf -s deepl -lo zh

方式三:Docker 部署(完全隔离)

docker pull pdfmathtranslate/pdf2zh
docker run --rm -v $(pwd):/app pdfmathtranslate/pdf2zh document.pdf

方式四:Windows 便携版

下载 Windows ZIP 包,无需安装 Python 环境,解压即用。

方式五:Zotero 插件

在 Zotero 中安装 pdf2zh 插件,在文献列表里直接右键翻译 PDF,适合科研人员日常工作流。

适用人群

  • 科研人员:快速翻译英文学术论文,阅读效率大幅提升
  • 学生群体:翻译课程材料、教材、论文,辅助学习
  • 技术文档读者:翻译技术白皮书、API 文档
  • 翻译工作者:借助 AI 翻译加速初稿,再用人工润色
  • 知识管理爱好者:配合 Obsidian、Zotero 等工具管理多语言文献

两个分支的区别

PDFMathTranslate 项目有两个主要分支:

  • Byaidu/PDFMathTranslate:稳定版主分支,适合大多数用户日常使用
  • PDFMathTranslate/PDFMathTranslate-next:开发分支,包含更多实验性功能(如 v2.0 内核),对边缘案例处理更好、跨栏跨页语义一致性更优,但不稳定,不接受社区贡献

普通用户使用稳定版主分支即可。

总结

PDFMathTranslate 精准切中了学术论文翻译”保排版”这一刚需,用 AI 大模型结合精确布局检测,解决了传统翻译工具在复杂文档上”公式乱码、图表错位、目录丢失”的核心痛点。项目配套完善——在线服务/CLI/GUI/Docker/Zotero 五种使用方式,同时支持 Google/DeepL/OpenAI/Ollama/MiniMax 等多种翻译后端,32.6k 星的数据充分说明了社区认可度。

如果你经常需要阅读英文技术文档或学术论文,PDFMathTranslate(pdf2zh)是一个值得长期留存的工具。尤其是内置了 DeepL 和 OpenAI 的高质量翻译选项,对于专业术语的准确性比免费 Google 翻译明显更胜一筹。

© 版权声明

相关文章

暂无评论

none
暂无评论...