查看: 3569|回复: 49

[知识科普] 一本电子书该怎么做

简洁模式
发表于 2022-10-8 10:34:47 河南 发帖际遇
昨天看有朋友@D·爱伦 说想做电子书,就说一说我自己做电子书的一些经验。
电子书的制作从大的方面来说主要包括四个部分
1.扫描
2.ocr(图形文字识别)
3.校对
4.制作电子书

1.扫描
一般来说,对于稀有书来说,特别是我今年买的三本外版书,本身不仅国内,连国外都没有电子档,所以拿到书以后第一部就是扫描。
扫描我知道对于大多数的学院里的人来说,都是使用的手机做扫描设备。
其实没什么不行的,只是手机有几个问题,第一手机毕竟不是专业设备,第二手机用的APP大多数也是要收费的。
所以为了后面的工作来说,我还是优先推荐使用扫描仪。像我个人使用的是下面这种比较便宜的手持式的扫描仪,这种扫描仪很便宜,在海鲜市场上100多就能收到包邮还带32g储存卡的那种,而且这种扫描仪不仅可以扫书,扫描一个笔记,手绘什么的都挺方便的。重点是扫描效果要好很多,而且普遍还带ocr驱动等等。
当然了,我选择用这种扫描仪,一个是省钱,第二个原因是省地方,毕竟高拍仪等设备要比这玩意儿占地方的多。

2.ocr
ocr其实是一个特别令人头疼的事儿。ocr的质量直接关联着你做书的速度。

ocr现在主要分为两种,一种是联网的,另外一种是不联网的。
托现在ai识别的福,目前联网的ai的ocr识别效果要远比不联网的效果要好很多。
所以如果愿意的话,选择联网的ocr效果肯定要更好。
但是毕竟联网的接口是要钱的,而每本书经常要几百页,所以要是没有免费的接口,还是挺贵的。
所以我一般用的是破解的abbyyfine reader,对于普通的英文和简体中文来说,还是比较好用的。

3.校对
校对这个是每次花时间最长的工作,第一步扫描一本书大概每次要花2-3个小时左右的时间,而校对的麻烦之处在于,你需要同时在两个文档之间找不同。
而这些错误可能是千奇百怪的,例如个别字符不识别,有的句子空了,有的识别的串行了,有的地方漏了,而且校对工作不能只做一遍,至少需要在3遍以上,而这三遍你可能根本没精力看书,全部精力都花在挑问题上。

4.电子书的制作
大部分工作其实在前三步的地方就做完了,电子书到这一步,如果不做epub,就基本上没什么问题了。
为什么要做epub。
第一,格式标准化。
第二,有目录和图表。因为大家都知道图表对于推理小说来说意味着什么
第三,效果丰富,基于HTML文件,可以最大程度上还原普通书。
具体怎么做,请参考这本书
《ePub指南——从入门到放弃》
https://zhuanlan.zhihu.com/p/29954562
软件推荐sigil。

如果你经历完了上面这些步骤,花了几百元加上好几天的时间,恭喜你,就得到了一本你独有的epub电子书了。
本帖子中包含更多图片或附件资源

您需要 登录 才可以下载或查看,没有帐号?加入学院

发表于 2022-10-8 10:39:02 广东| 发自安卓客户端
话说平成大佬真的很行动派我刚刚开始看到那个书缝里面扫描也是吓一跳
登录帐号可查看完整回帖内容
发表于 2022-10-8 10:39:23 北京| 发自安卓客户端 发帖际遇
我来补充下,如果不想买设备,可以考虑下白描APP。手机拍照扫描,图像可以优化,歪斜调整。支持生成PDF。不买会员,一天可以图像识别50页,支持校对。买会员(40)识别数量不限次数。
登录帐号可查看完整回帖内容
发表于 2022-10-8 10:40:32 北京| 发自安卓客户端 发帖际遇
补充,这个支持繁体(竖版)和外文识别, 自带翻译。
登录帐号可查看完整回帖内容
发表于 2022-10-8 10:48:40 北京| 2022-10-8 10:50编辑 | 发自安卓客户端 发帖际遇
补个图
本帖子中包含更多图片或附件资源

您需要 登录 才可以下载或查看,没有帐号?加入学院

登录帐号可查看完整回帖内容
发表于 2022-10-8 10:58:22 湖北| 发自安卓客户端
非常有用,感谢平成佬!
发表于 2022-10-8 11:04:55 安徽| 发自安卓客户端
支持!
发表于 2022-10-8 11:22:35 山东| 来自小霸王手机
感谢大佬
发表于 2022-10-8 11:34:01 陕西| 发自安卓客户端
昨天刚研究了一晚上这些软件,今天就来帖了
学不废的小伙伴可以用easypub,这个简单好用
登录帐号可查看完整回帖内容
7
发表于 2022-10-8 11:52:08 福建
虽然我不做电子书,不过一般是用一款叫白描的软件来识别文字。之前试过繁体竖排都可以正确识别
登录帐号可查看完整回帖内容
返回版块
12
尚未登录
您需要登录后才可以回帖 登录 | 加入学院