DOKK / manpages / debian 11 / calibre / ebook-convert.1.zh_CN
EBOOK-CONVERT(1) calibre EBOOK-CONVERT(1)

ebook-convert - ebook-convert

ebook-convert input_file output_file [options]


转换不同格式的电子书。

input_file 表示输入文件,output_file 表示输出文件。这两者作为命令行参数必须指定到最前面。

输出的电子书格式可由 output_file 的扩展名得到。同时 output_file 也可以是一种以 .EXT 为扩展名的特殊格式。在这种情况下,输出文件的名称则使用输入文件的名称。注意:文件名不能以连字号作为开头。如果 output_file 不含扩展名,那么它将被视为一个目录并将会在该目录下生成 HTML 格式的“开放式电子书(OEB)”。这些文件会被视为正常文件而被输出插件所识别。

在指定输入和输出文件后,你可以自定义特定的转换选项。根据输入和输出文件的类型不同可用的转换选项也不同。如需获取针对输入和输出文件的帮助,请在命令行中输入 -h。

对于转换系统的完整文档请查阅 conversion

每当向具有它们自己空间的:command:

`
ebook-convert`传递参数时,用引号括起这些参数。例如: "/some path/with spaces"

选项以及选项的默认值都取决于输入 和输出格式,所以你应该经常检查

ebook-convert myfile.input_format myfile.output_format -h

以下是一些常见转化的选项,接着 是特定输入输出的选项

  • 输入格式选项
  • 输出格式选项
  • 界面外观
  • 启发式处理
  • 查找并替换
  • 结构检测
  • 目录
  • 元数据
  • 调试

显示此帮助信息并退出

设置输入配置文件。此配置文件让程序了解如何解析输入文件并进行转换。例如页面分辨率(i.e. 以像素为单位)。可选项有:cybookg3, cybook_opus, default, hanlinv3, hanlinv5, illiad, irexdr1000, irexdr800, kindle, msreader, mobipocket, nook, sony, sony300, sony900

列出内建的订阅清单名。你可以通过如下命令创建基于内建订阅清单的电子书: ebook-convert "Recipe Name.recipe" output.epub

设置输出配置文件。输出配置文件可以让转换系统针对指定的设备优化文档(例如通过根据设备屏幕大小缩放图片)。在某些情况下,可以用输出配置文件对特定设备优化输出,但几乎没有必要。可选项有:cybookg3, cybook_opus, default, hanlinv3, hanlinv5, illiad, ipad, ipad3, irexdr1000, irexdr800, jetbook5, kindle, kindle_dx, kindle_fire, kindle_oasis, kindle_pw, kindle_pw3, kindle_voyage, kobo, msreader, mobipocket, nook, nook_color, nook_hd_plus, pocketbook_900, pocketbook_pro_912, galaxy, sony, sony300, sony900, sony-landscape, sonyt3, tablet, generic_eink_large, generic_eink, generic_eink_hd

显示程序版本号并退出

输入格式选项

处理输入文件 mobi 的选项设置

指定输入文件的编码格式。该设置将覆盖文档声明的编码格式。该设置对于未声明编码格式和错误编码格式的输入文件处理十分有用。

输出格式选项

处理输出 epub 的选项设置

关闭按分页符切割. 默认情况下, 程序会按分页符将输入文件切切分为多个文件. 由此程序可以使用较少的计算机资源来解析和输出结果. 当然切分操作会增加处理时间, 如果输入文件含有较多的分页符, 请关闭此功能.

仅在你需要使用 FBReaderJ 阅读 EPUB 文件时使用本选项。启用本选项会消除 EPUB 文件中的目录结构,把所有文件放到同一层目录中。

插入的一个内嵌内容的表格会作为图书主内容的一部分出现。

在书籍的末尾插入内嵌目录,而不是书开头。

要生成的 EPUB 文件版本。EPUB 2 是最具广泛兼容性的,只有在你确实需要的情况下才使用 EPUB 3。

解压EPUB文件的内容到指定文件夹。请注意该文件夹会先被清空。

将大于该大小 (以KB为单位) 的HTML文件切分。由于很多EPUB阅读器无法打开巨大的文件,故此功能十分有用。默认值 260KB 是Adobe Digital Editions 的文件大小要求。设置为0来禁用大小为基准的切分。

正常情况下,如导入的文件无封面并且你也未指定,则会生成一张带有书名、作者等信息的默认封面。选定此选项可以禁止生成默认封面。

请不要使用 SVG 作为书籍封面。如果你打算将 EPUB 文件用到不支持 SVG 格式的设备(像 iPhone 或 JetBook Lite)上的话,请使用该选项。不选中此选项的话,这类设备将只能显示封面为一个空白页。

当使用 SVG 封面时,该选项会导致封面平铺满有效的屏幕区字段,但仍会保持它的纵宽比(宽度和高度的比例)。意思就是说,这可能会在图像顶边或底边处产生空白边界,但是图像本身不会被扭曲变形。不选该选项的话,图像可能会产生轻微的扭曲变形,但优点是不会出现空白边界。

如果开启本选项,输出插件将尽量生成可读的输出内容。对于某些输出插件本选项可能不起作用。

生成的行内目录标题。

界面外观

输出的界面外观选项设置

Transliterate Unicode characters to an ASCII representation. Use with care because this will replace Unicode characters with ASCII. For instance it will replace "Михаил Горбачёв" with "Mikhail Gorbachiov". Also, note that in cases where there are multiple representations of a character (characters shared by Chinese and Japanese for instance) the representation based on the current calibre interface language will be used.

PTS中的基本字体大小。在生成的书籍中所有的字体尺寸将基于这个大小重新缩放。通过选择更大的尺寸,可以使输出中的字体更大,反之亦然。默认情况下,当值为0时,根据你选择的输出配置文件选择基本字体大小。

更改文本对齐方式。 使用值"left" 将转换资源中所有的文本为左对齐。 (如:未对齐) 使用值"justify" 将转换资源中所有的未对齐的文本为对齐。使用值"original"(默认)则不更改源文件的对齐方式。请注意,仅部分输出格式支持对齐方式。

关闭字体缩放功能。

嵌入输入文档中引用到但未嵌入的字体。软件会在你的系统中查找这些字体,找到了就嵌入。字体嵌入只有当你的目的格式支持才有用,例如 EPUB、AZW3、DOCX 和 PDF。请保证你拥有在文档中嵌入字体的合适授权。

在书中嵌入指定字体。这指定了书中使用的“基础”字体。如果输入文件自己指定了字体,就有可能覆盖这个基础字体。你可以使用过滤样式信息的选项来去除输入文件的字体。注意,字体嵌入只在一些输出格式中有用,主要是 EPUB、AZW3 和 DOCX。

默认情况下,calibre 将使用各种CSS属性的简写形式,如边距、填充、边框等。此选项将使用完整的展开形式。注意,在生成EPUB文件时,由于Nook不能处理速记CSS,所以将输出配置文件设置为Nook配置文件中的一个,CSS总是被展开的。

CSS 样式表或原始 CSS 文件路径。该 CSS 样式表将会被添加到源文件的样式规则中,它可以覆盖输入文件中已定义的相同样式。

以逗号分隔的 CSS 属性列表,将移除所有 CSS 样式规则。这是非常有用的,如果存在的一些样式信息,防止覆盖你的的设备上的样式信息。例如:字体系列,颜色,左边距,右边距

将CSS字体名称映射为以pts为单位的字体大小. 例如12,12,14,16,18,20,22,24. 这些设置是从xx-small到xx-large的对应映射, 最后的大小作为做对应的最大字体的映射. 程序用这些尺寸进行只能文字字体缩放. 程序默认使用输出配置文件中指定的映射关系.

在章节之间插入空行. 如果源文件不使用章节标记 (<p> 或 <div> 标记) 本选项将不起作用。

设置插入的空白行的高度(单位:em)。段落间的空行高度会是两倍于这个设置值。

保留输入文档中的“印刷连字”。所谓“印刷连字”是指对于ff, fi, fl之类的字母组合的一种特殊的展示方式。大部分阅读器在使用默认字体时无法支持“印刷连字”,所以常常无法正常显示。默认情况下,calibre 会把“印刷连字”转换成对应的字母组合。本选项用于选择保留“印刷连字”。

pt 行高。控制两行高度距离。仅仅适用于未定义行高的元素。大多数情况下,最小行高值更加有用。默认不进行行高操控。

一些布局不佳的源文件使用表格来设置页面布局可能会导致输出文件中的正文超过页面范围。本选项设定程序将内容从表格中提取出并以线型布局排列输出。

设定下边距,单位pts。默认为 5.0。如果设置为负值表示不使用页边距(保留使用原始文档的页边距)。提示:页面原始格式如PDF和docx有自己优先的边距设置。

设定左边距,单位pts。默认为 5.0。如果设置为负值表示不使用页边距(保留使用原始文档的页边距)。提示:页面原始格式如PDF和docx有自己优先的边距设置。

设置右边距,单位pts,默认为 5.0。如果设置为负值表示不使用页边距(保留使用原始文档的页边距)。提示:页面原始格式如PDF和docx有自己优先的边距设置。

设定上边距,单位pts。默认为 5.0。如果设置为负值表示不使用页边距(保留使用原始文档的页边距)。提示:页面原始格式如PDF和docx有自己优先的边距设置。

最小行高,元素字体计算值的百分比。calibre 将保证行中所有元素至少有此高度,无论输入文档如何定义。设为零即禁用。默认 120%。首选项中也有此设定,请注意。否则可能出现双倍行高,达 240%。

移除段落之间的空行. 同时设置段落缩进为1.5em. 如果源文件不使用段落标记 (<p>或者<div>标签)程序将不执行段落空行移除.

当 calibre 删除段落之间空行时,它会自动设置一个段落缩进,以确保轻松区分段落。此选项控制缩进的宽度(单位 em)。如果你将此值设置为负数,则使用输入文件中自身定义的缩进,换句话说就是 calibre 不进行缩进处理。

将普通引号、破折号和省略号转换为与它们对应的正确印刷体。有关详细信息, 请参阅 https://daringfireball.net/projects/smartypants

嵌入所有字体中用到的字。每种嵌入字体缩减到只包含文档中用到的字型。这能减小字体文件的体积。在嵌入某个特别大的,包含大量未使用字的字体时有用(如中文)。

包含转换本书中CSS样式规则的文件路径。创建这样一个文件的最简单方法是在 calibre GUI中使用向导创建规则。在“界面外观->转换风格”的转换对话框部分访问它。 一旦创建规则,就可以使用“导出”按钮将它们保存到文件中。

转换各种形式的引号、破折号和省略号到它们的标准形式。

启发式处理

使用常见模式修改文档内容与结构。默认禁用。使用 --enable-heuristics 启用该功能。具体选项可以通过 --disable-* 参数禁用。

分析文档中带有连字符的单词。这个文档本身被作为一个词典来确定连字符应该被保留还是被删除。

移除文档中每个段落间的空白段落。

把多个空格构成的段落缩进转换为 CSS 控制的缩进。

对齐左对齐的小节分节符。把多个空白行表示小节分节符替换为水平横线。

寻找用于表示斜体的常见的词语或模式并把它转换为斜体。

检测未格式化的章节标题和子标题。把它们从二级标题 (<h2>) 标签转换为三级标题 (<h3>) 标签。这个选项不会创建目录,但可以与文档结构检测功能一起使用并创建目录。

查找顺次出现的<h1>或<h2>标签。这些标签被重新编号以防止在章节头部中间断开。

决定某行是否为段落内的换行时,使用标点符号和其它格式做为线索。

启用智能处理。在需要使用任何智能处理选项时都必须先启用这个选项。

决定一行字符是否能成为一个新的段落的因子,有效值为 0 到 1 之间的小数,默认值是 0.4,即略小于半行的长度。如果文档中只有很少的行需要消除段落内换行,应当减小这个设置值。

把小节分节符替换为指定的文本。在默认情况下,会使用输入文档中的文本。

查找并替换

以用户预定义的模式修改文档内容和结构。

包含搜索和替换正则表达式的文件路径。该文件必须包含正则表达式交替行后面跟着替换模式(它可以是一个空行)。正则表达式必须是Python正则表达式的语法并且文件必须是UTF-8编码。

第一项搜索的替换文本。

第一项要被替换的搜索模式(正则表达式)

第二项搜索的替换文本。

第二项要被替换的搜索模式(正则表达式)<

第三项搜索的替换文本。

第三项要被替换的搜索模式(正则表达式)<

结构检测

设置自动检测文档结构。

XPath 表达式用于检测章节标题。默认考虑使用 <h1> 或 <h2> 标签来涵括“章节”,“书籍”,“节选”,“前言”,“结束语”,或者使用任何标签包含级别 =“章节”的“部分”做为章节标题。使用的表达式必须评估元素列表。要禁用检测章节,请使用表达式“/”。请参阅 calibre 用户手册中的 XPath 教程了解使用此功能的更多帮助。

--chapter-mark
设置标注章节的模式. "pagebreak"模式会在章节前插入下一页控制符. "rule"模式会在章节前插入空行. "none"模式不会在章节前插入控制. "both"模式会在章节前插入下一页控制符和空行.

有些文档通过在每一页上指定左右页边距来指定页面边框大小。 calibre 会尝试检测并移除这些页边距。有时候 calibre 会错误的移除不应该移除的页边距,在这种情况下,你可以禁用这项功能。

将书籍元数据添加到书籍的开始。如果你的电子书阅读设备不支持显示和搜索元数据功能,该功能可以有所帮助。

XPath表达式。在指定的元素之前插入分页符。禁止使用表达式: /

使用从源文件中检测到的封面文件.

移除输入电子书的第一个图像。这是有用的如果输入文档有一个封面图像,但没有确定为封面图像。在这种情况下,如果你在 calibre 设置了封面,如果你不指定此选项,输出文件将最终有两个封面图片。

用于检测文档中开始阅读位置的 XPath 表达式。某些电子书阅读器(以 Kindle 为代表)使用此定位标识来打开书籍。请参阅 calibre 用户手册中的 XPath 教程了解使用此功能的更多帮助。

目录

设置自动生成目录。默认情况下若源文件有目录,它将被首选自动创建。

在基于输入文档中的链接创建目录时,允许创建重复项。即在目录中允许出现名称重复的项,但它们指向文档中不同的位置。

指定应添加到目录级别1的所有标签的 XPath 表达式。如果指定此项,它会优先于其他自动检测形式。可查阅 calibre 用户手册中的 XPath 向导。

XPath 表达式指定所有标签应添加在二级目录表。每个条目加入到一级目录条目下。请参阅 calibre 用户手册中 XPath 教程的例子。

XPath 表达式指定所有标签应添加在三级目录表。每个条目加入到二级目录条目下。请参阅 calibre 用户手册中 XPath 教程的例子。

输出文件目录中的最多链接项数量。设置为 0 表示关闭。默认值:50。只有在检测到的章节数量小于该阈值时这些链接项才会被添加到目录中。

不将自动检测到的章节添加到文件目录。

从目录中移除匹配该证则表达式的链接项, 它们的子项也会被同时移除M.

如果检测到的章节数少于该数字,则在目录中添加这些章节的链接。默认值: 6

通常情况下,程序会引用源文件中已有的目录。打开本选项来强制使用自动生成的目录。

元数据

设定输出的元数据选项

用以进行按作者排序的关键字符串。

设置作者。多个作者之间请使用 & 符号分割。

设置书籍制作人。

设置电子书描述。

设置封面为指定文件或 URL

设置书籍的 ISBN。

设置书籍语言。

设置发布日期(假定在本地时区,除非明确指定时区)

设置电子书出版商。

设置评分。评荐值为 1 到 5 之间的数字。

从指定 OPF 文件中读元数据。读取的元数据将覆盖源文件中定义的其他元数据。

设置书籍所属丛书。

--series-index
设置书籍在丛书中的索引位置。

设置书籍的标签。多个标签之间请用逗号隔开。

设置书籍时间戳(已不再使用)

设置标题。

--title-sort
用作排序的书籍标题序列数字。

调试

用于调试转换的选项

在转换过程的不同阶段分别保存输出到指定目录。如果你不确定在哪个阶段出了问题,这个选项非常实用。

详细程度。指定多次来提高详细程度:指定两次是最详细,一次是中等,零次是最简略。

Kovid Goyal

Kovid Goyal

二月 26, 2021 5.12.0