先把扫描版 PDF 变得可读,再进入翻译。
扫描版 PDF 不是普通文本 PDF。它通常先需要 OCR 和结构恢复,翻译结果才真正可用。Doc2X 更适合这种图像型文档工作流。
- 适合 OCR 场景
- 适合图片型 PDF
- 更可读的翻译结果
为什么做扫描件翻译页
- 扫描件先要经过 OCR 和结构恢复,翻译结果才更有意义。
- 文档型工作流比人工拆文本再翻译更顺。
- 即使 OCR 完成后,用户仍然需要更适合阅读的翻译结果。
如何翻译扫描版 PDF
- 1. 把扫描版 PDF 放进网页翻译流程把扫描版 PDF 放进网页翻译流程。
- 2. 先恢复可读结构,再进入翻译先恢复可读结构,再进入翻译。
- 3. 查看翻译结果并继续阅读、校对或整理查看翻译结果并继续阅读、校对或整理。
更适合这些扫描版 PDF 场景
- 归档后扫描成图片的报告
- 纸质资料转成 PDF 的扫描件
- 仍需翻译的低可编辑 PDF
常见问题
- Doc2X 可以翻译图片型扫描版 PDF 吗?可以用于需要先让扫描件变得可读、再进入翻译的文档型流程。
- 为什么扫描版 PDF 比普通 PDF 更难翻译?因为扫描件往往不包含可直接使用的文本,必须先经历 OCR 和结构恢复,翻译才有实际意义。
继续浏览同主题页面
先让用户在同一类解析或翻译意图里继续深入,再去看其他内容。
也值得继续看的相邻主题
把翻译页和解析页连接起来,让站点更像一个完整产品网络。
继续浏览 Doc2X 站内页面
补上指向当前语言首页和另一种语言版本的明确站内链接。
开始翻译扫描版 PDF。
这类页面服务的是非常明确的 OCR 型翻译意图。
打开翻译