发表于 2024-11-19 01:10:53 河南| 2024-11-19 16:41编辑 | 发自安卓客户端
早就想写的教程了,看到有人问我,那简单写了吧。

适合小白的,
一整套翻译“竖排日文pdf小说”流程:

看到评论区的回复补充:
我似乎应该把最好的方案效果截图放在开头:
图片是1984年的,不够清晰,且带很多注音小字的竖排日文pdf文档
原图:

译图:

这里你看注音小字,和那个底部序号都不会识别,从而干扰翻译。
注音小字我试了很多张都没有,底部序号小概率还是会出现。




我最开始没发最好的效果,是因为我毕竟写的是整个流程的教程
要说单发个效果最好的付费方案效果图,
那我还写了效果差点的/麻烦的免费方案啊,这不纯抬高预期吗
没办法,只能先发图,不啰嗦了开始全流程:

第一,竖排日文pdf文件下载,
随你在各个论坛,或者“安娜图书馆”这种库存下载。
(这个要.提.子.)
https://zh.annas-archive.org/



第二,简单处理,
你可以用这个网站将pdf文件拆分为几百张图:

https://tools.pdf24.org/zh/split-pdf



第三,文字识别,这里拓展一下:

可以不要钱的:识别竖排日文的软件
似乎只有pc端的“.a.b.b.y.y.”
我反正之前试过不满意识别率,但是也能用。
你可以自己去找,额,学习版
我看b站似乎就有学习版
但是有一说一,我几年前装这个直接给我电脑搞蓝屏了一次,
并且当时d盘的头像还被这软件替换了,功能倒是没问题
换电脑之后就再没用过这软件

要钱的:我之前和一个人鼓捣好几天找好方案,
或者识别率不行,
或者能识别,但是像google和白描的ocr识别,
会把“日文注音小字”也识别出来
翻译质量直接大打折扣。

最后感觉只有“团子翻译器”的批量漫画翻译功能,
https://translator.dango.cloud/

识别率还可以,又不会识别注音小字。
别急,这个流程也有问题,不是那么简单的。
1:费用20/月,这倒还好,你可以攒一堆书然后一起识别嘛
2:这软件说到底是翻译漫画的,
他没有做适配识别小说的便捷流程,
我给作者反馈过,但他似乎是不想做
也就是说,你确实可以用这软件一键识别一本竖排日文pdf
(把流程二导出的几百张图导入漫画翻译功能,然后导出文字)
但是,你点“导出文字”,
软件会把原文,译文,
包括你用的翻译服务名全导出混在一起
你只能手动一条条把日文复制出来
只要日文,翻译功能在别的软件做

我拜托过一个程序朋友,写程序分离出日文
结果不能保证百分百准确率,也就是说你还是一条条复制吧。
快捷键我记得是ctrl加选,
反正我感觉复制几百张图的识别日文,
也就十分钟吧,可看你接受程度


总结,团子翻译器这套流程,
就是你从首页选项卡点进那个图片翻译的功能,
然后批量导入图片,翻译好,关闭图片翻译,
再回到首页选项卡找翻译记录导出txt文字。
翻译服务就选谷歌之类的都行,毕竟我们只要日文。
然后手动ctrl把导出文字里的识别日文复制出来。
注意我看到评论区提示,重新去截图才发现的:
你得一次导入好几张图翻译,单独一张图,翻译历史里没有记录。


第四,有了识别到的日文之后,
就是AI翻译了。
这里直接去看我第一个教程
简单来说就是,随你手机或者电脑下载“沉浸式翻译”
然后自己去注册AI大模型的官网注册API服务,
(教程我第一个教程写了,沉浸式翻译的教程也写了

https://immersivetranslate.com/zh-Hans/docs/services/deepseek/

然后导入配置到沉浸式翻译里调用服务就能简单翻译电子书了。

这里我只简单补充点新结论:
在翻译质量方面,质量和提示词(prompt)关系很大
在沉浸式翻译默认的提示词下,中英翻译是“deepseek”最好
然后切换到“意译大师”那个提示词,
这个流程似乎是翻译一遍,优化一遍,增加质量但也增加消耗的token
此时就是qwen 2.5 72b效果最好
然后中日翻译是claude 3.5 sonnet效果最好。
(不过claude价格可比上面这俩贵,你要性价比,
与其claude选常规提示词翻译一遍,
不如选这俩便宜的模型加上意译大师提示词,
翻译一遍优化一遍更好还便宜。


哦这里说的翻译一遍优化一遍是他内部翻译的流程
我们用那就是傻瓜操作,点一下等翻译好








最后再顺便补充下,
和标题没什么关系,
就是一些ocr识别服务的大杂烩。

我研究方案的时候,接触了不少。
你如果想批量识别横排的,不管是繁体简体,中文英文,
那我上面提的“白描”也行,这个也要钱,手机电脑都有,
价格在“果壳剥壳”卖好像是二十几买断。
然后白描也能识别表格,

但是识别公式,据说是“mathpix”最好
这软件我用过,也是收费,而且有点恶心人的
然后简单的ocr识别,各个手机厂商似乎都推出了自己的服务
谷歌的“智能镜头”也还行。
复杂的,一整本pdf里识别表格公式,这个就很难了,
我看b站有人在研究用AI多模态大模型和传统ocr服务结合来识别。

再顺带一提,github上也有不错的开源软件
比如有个叫“manga ocr”的似乎是可以识别竖排日文
但本人智力有限,实在是不会部署,
有的别的软件部署之后也不会写代码做到批量识别
总之就是摆了,不会用。



最后,我才发现本软件排版技巧
你选了“字体加红加粗”之后
如图,想要正文呈现的效果是换行,
你得在编辑界面,这个代码之后空一行
同理,想正文空一行,就得在编辑这里空两行
我说之前发的帖子,排版看着怪呢,很多字就连在一起
本帖子中包含更多图片或附件资源

您需要 登录 才可以下载或查看,没有帐号?加入学院

楼主| 发表于 2024-11-19 12:09:27 河南| 2024-11-20 08:00编辑 | 发自安卓客户端
我有要补充的内容,就固定在这楼补充了。
帖子编辑一次都得重新审核太麻烦。

0:类似的githubocr方案,还有这个
https://meta.appinn.net/t/topic/62859
不过这是用来翻译带公示表格论文的,
很明显这些有实力的大佬不会研究竖排日文文档
这才是目前起码我找不到合适开源方案,批量简易翻译竖排日文pdf文档的原因

1:我才想起来,就是如果你的素材比我这个模糊不少
那似乎可以考虑lr批量加对比度调整
和团子翻译器这软件设置里我看有个实验性“超分辨率”
可以试试,我没试过,我跑通了这个流程就没关系了
毕竟我又没有翻译这种数的需求。

2:我刚才改帖子居然秒审核通过,搞得我都不好意思再改了

3:我其实没有这类需求,为什么研究流程呢?
一是自己对新技术感兴趣,
二是有人拿着这个1984年的的这个竖排日文pdf问我了
这就不得不提:我研究那时候还非常热
当时我有一次吹风扇吹得肚子巨疼,真是感觉马上要噶了。
要不是刷到一个b站视频,说是按压左手什么穴位,确实缓解了,
那都难以想象
就在那天,我轻松不少的时候,都是咬了两块饼干,
继续上qq和那人研究流程。
所以,本人这帖子,耗费的精力还是有一点的。

4:帖子中间不是提到了那个a.b.b.y.y.嘛
传说国内代理商很强,因此在国内公开互联网上找不到学习版
我一听这话好家伙,看看资源检索能力?
直接就去telegram搜搜看,翻了几页就见到了
当然只是这么一找,实际我肯定不会用
因为我看b站评论区都说这软件有问题,会和win11安全中心冲突什么的。
我本来几年前试用这软件的时候就没什么好印象

5:我想到我末尾提到的“github也有不少优秀开源ocr项目,
只是我完全不懂代码不知道怎么部署和批量识别”
我又想了想,感觉简单需求,还是可以问AI来教我python代码,如图
但问题在于,稍微复杂的问题,比如我正文提到的“只保留日文”AI代码,
公认最好的claude也不行。
你说批量识别文本,我总得要求这些文本打包到一个文档里,
还要注意排版,还要消除文档需要之类的吧?
感觉ai很难满足这种需求

哦ai的代码能力,公认最好的是国外的claude,
然后平替,国内的deepseek也还凑合,
然后最近刚出的,国外google的类open ai o1的gemini 1114也还行
本帖子中包含更多图片或附件资源

您需要 登录 才可以下载或查看,没有帐号?加入学院

登录帐号可查看完整回帖内容
发表于 2024-11-19 12:55:13 江苏
朋友,关键是Z站上和安娜图书馆下载的日文PDF文件,有些小说资源年代太过古老导致PDF文件图像质量模糊不清晰,EPUB日文原版的注音平假小字就难以解决了,PDF文件更是把小字和大字混合在一起狼狈不堪,搞不明白日本搞这种注音平假小字是干嘛的,谷歌机器翻译都没的操作,很多小说资源不是没得找而是就算找到了也没得翻译
登录帐号可查看完整回帖内容
发表于 2024-11-19 13:25:36 上海| 来自小霸王手机
关键是日语原版的新小说都找不到
楼主| 发表于 2024-11-20 08:01:42 河南| 发自安卓客户端
...???这还能直接吞评论
登录帐号可查看完整回帖内容
发表于 2024-11-20 11:55:11 陕西
epub还好,可以保留格式复制文本到word里,然后清除读音,就可以去掉小字了。 pdf是真的麻烦,先不说ocr的识别率了,那个换行短句就很恶心
登录帐号可查看完整回帖内容
尚未登录
您需要登录后才可以回帖 登录 | 加入学院