OmegaT 的自定义过滤器是其主要特色之一,它让你可以对过滤器的多数工作进行设置。文件过滤器是一堆代码,它能够:
从某些特定文件格式中读取文档。例如:纯文本文件。
将可翻译的内容从文件中提取出来。
通过将可翻译内容替换为可译内容,自动对可翻译文档文件名进行修改。
多数用户应该会对缺省的文件过滤器选项感到满意。如果不满意,可以从主菜单中选项 -> 文件过滤器……打开主对话框。警告! 在项目处于打开状态时修改过滤器选项可能会导致数据丢失。请注意:如果你在项目打开的时候改变片段分割选项,你必须重新导入项目以使改变生效。
该对话框列出了可用的文件过滤器。如果你不想使用 OmegaT 翻译某些类型的文件,你可以将它们文件名旁边的复选框的对勾符号去掉而将该过滤器关闭。这样一来,OmegaT 在打开项目时将会忽略这些文件,并且在创建目标文档时对它们进行原封不动的复制。如果之后你又决定使用这些过滤器,只需勾上这些复选框。点击 缺省[Defaults] 可将文件过滤器恢复为缺省设置。要想对某个过滤器以何种编码处理何种文件进行编辑,可以从列表中选中该过滤器然后点击编辑按钮。
五种过滤器(文本文件、 XHTML 文件、HTML 和 XHTML 文件、开发文档/文件和 微软开发 XML 文件)有一个或多个特别选项。要修改这些选项,请从列表中选择该过滤器,并点击 选项[Options]按钮。可选项包括:
在换行、空行处进行片段分割或者不分割: 如果激活了句子分割规则,文本将会按照现有规则作进一步分割。
编码声明: OmegaT 将以目标文件所所选的编码方式[encoding]增加或覆盖文件的编码声明。
属性翻译: 所选中的属性将会以片段的形式出现在编辑器窗口中。
按 <br> 分割段落:按照 HTML 的 <br> 标签分割段落。
忽略文本匹配正则式: 匹配该正则式的文本将会被忽略。
以下元素是否进行翻译。如果被翻译,它们将以单独片段的形式出现。
以下元素是否进行翻译。如果被翻译,它们将以单独片段的形式出现。
该对话框允许你设置该过滤器所处理的文件的源文件名模式,定制已译文件文件名,并为它选择用何种编码来导入文件及保存已译副本。要修改文件过滤器模式,可直接修改该字段或点击 编辑按钮。要新增一个文件过滤模式,可点击 新增。新增模式和编辑特定模式使用的是相同的对话框。该对话框非常有用,因为它带有的特定目标文件模式编辑器允许你自定义输出文件的名称。
当 OmegaT 在源文件夹中发现一个文件时,它将首先根据文件的扩展名试着选择过滤器。更确切地说,OmegaT 尝试着用每个过滤器的源文件名模式对文件名进行匹配。例如, *.xhtml
模式将会匹配任何以 .xhtml
为扩展名的文件。如果找到了合适的过滤器,它将被用来处理该文件。比如说:缺省情况下 XHTML 过滤器将会用来处理以.xhtml
为扩展名的文件。 你可以对每个文件过滤器要处理文件的名称模式进行修改或增添。源文件名模式中使用的匹配字符与 搜索 中所使用的类似。'*' 字符匹配零或多个字符。'?' 字符只匹配一个字符。所有其它字符代表自身。比如,如果你希望文本过滤器处理 readme 文件( readme
、 read.me
和 readme.txt
),你应该使用模式 read*
。
仅少量文件格式必须指定强制性的编码方式。未指定编码方式的文件格式将使用您所设定的匹配该名称的扩展名的编码方式。例如,缺省情况下 .txt
文件将会使用系统缺省的编码导入。你可以对每种源文件名模式的源编码进行修改。这些文件也可以任何编码方式输出。缺省情况下,已译文件的编码与源文件的编码相同。源和目标编码字段使用的组合框包括了所支持的全部编码。<auto> 将编码选择工作留给了 OmegaT 。以下是其工作原理:
OmegaT 通过 (HTML 文件、基于 XML 的文件中)可能存在的编码声明来查找源文件编码。
OmegaT 被设置为使用某种强制性编码(Java 属性等)。
OmegaT 为文本文件使用缺省的系统编码。
有时你也需希望系统自动将译好的的文件重新命名,比如在文件名后加上语言代码。目标文件名模式使用特殊的语法规则,因此如果希望编辑这些字段的话,你最好点击 编辑…… 以使用编辑模式对话框。如果你想恢复到缺省的过滤器设置,点击缺省。您也可以在文件过滤器对话框中的目标文件模式字段中直接修改名称。模式编辑对话框提供了以下选项:
缺省设置是 ${filename}
—— 和源文件完全相同的文件名和扩展名,因此已译文件的名称将和源文件名完全一样。
${nameOnly}
——只插入源文件的名称,而不包括扩展名。
${extension}
—— 源文件的扩展名。
${targetLocale}
——目标文件的地区代码 (以"xx_YY"的形式)
${targetLanguage}
——目标语言和国家代码(以 "XX-YY"的形式)
${targetLanguageCode}
——目标语言代码 ("XX")
${targetCoutryCode}
——目标国家代码 ("YY").
法律声明 | 首页 | 内容索引 |