OmegaT には高度にカスタマイズ可能なフィルタ機能があり、さらにその多くの挙動設定を変更できます。ファイルフィルタは以下のような機能を持ったコードの集まりです:
ある特定のファイル形式の文書を読み込みます。例えばプレーンテキストファイルです。
そのファイルから翻訳可能な部分を抽出します。
その翻訳可能な部分を翻訳後の内容に置換することで、翻訳された文書としてのファイル名修正を自動化します。
多くのユーザーにとっては、ファイルフィルタ設定はデフォルトのままで問題ないでしょう。もしそうでなければ、メインメニューから 設定 → ファイルフィルタ... を選択してダイアログを開いてください。注意! プロジェクトを開いているときにフィルタ設定を変更すると、プロジェクトのデータを失う可能性があります。フィルタ設定の変更を適用するにはプロジェクトの再読み込みが必要です。
使用可能なファイルフィルタを一覧表示します。OmegaT の中で翻訳したくないファイル形式がある場合は、ファイル形式名の横にあるチェックボックスをを外すと、その形式に対してはフィルタ機能を使用しないようにすることができます。プロジェクトの読み込み時、選択されていないファイル形式のファイルは無視され、訳文生成の時に未変更の状態で訳文フォルダにコピーされます。 その後、フィルタを使用したいと決めた場合はそのチェックボックスにチェックを入れてください。初期値 をクリックすると、それまでのフィルタ設定をリセットし初期設定に戻します。各フィルタが処理するファイルの種類とエンコードを変更する場合は、フィルタを選択して、編集... をクリックしてください。
以下の5つのフィルタ(テキストファイル、 XHTML ファイル、 HTML・XHTML ファイル、 OpenDocument や OpenOffice.org ファイル、 Microsoft Open XML ファイル)では、複数の詳細な設定が行えます。設定を変更する場合、フィルタを選択し 設定... を押してください。可能な設定は以下の通りです:
段落ごとの分節化をどのように行うか(改行/空行/しない から選択): 分節化規則が有効である場合、この設定でテキストをさらに分節化させることができます。
エンコード宣言の追加・変更: 訳文ファイルのエンコード宣言を、この設定に従って追加または変更できます。
下記の属性は翻訳対象です: 選択した属性を編集ウィンドウで分節として表示できます。
<br> タグで分節を作る: HTML の <br> タグがある場所を段落として分節化することができます。
正規表現に一致する文字列を翻訳対象から除外する: 指定した正規表現に一致するテキストは、翻訳対象とせずスキップすることができます。
以下の要素を翻訳対象とするかどうかを設定できます。翻訳する場合、これらは独立した分節として表示されます。
以下の要素を翻訳対象とするかどうかを設定できます。翻訳する場合、これらは独立した分節として表示されます。
このダイアログでは、フィルタ処理したい原文ファイルのファイル名構成例の設定や、訳文ファイル名の設定、またそれぞれ両者のファイル読み込みや保存を行う際のエンコードを選択することができます。ファイルフィルタ構成例を編集するには、それぞれの欄を直接修正するか、 編集 をクリックします。新しいファイルフィルタ構成例を追加するには 追加 をクリックします。構成例の追加と編集では同じウィンドウを使用します。このダイアログは、特別なファイル名構成例エディタを持っており、出力するファイル名の設定が可能なので便利です。
OmegaT は原文フォルダにファイルを見つけると、まず拡張子から判別してファイルフィルタを選択しようとします。さらに具体的に言うと、ファイル名に対して、各ファイル名構成例のうちから一致するものを探索します。例えば、構成例 *.xhtml
は、拡張子が .xhtml
のあらゆるファイルに一致します。適切なフィルタが見つかれば、そのファイルを処理するように設定されます。例えば、デフォルトの XHTML フィルタは、拡張子が .xhtml
のファイルを処理するのに使用されます。各フィルタが扱うファイル名構成例は、変更や追加が行えます。原文ファイル名構成例には、 検索 機能と同様にワイルドカードが使用できます。 '*' 文字は 0 個以上の任意の文字と一致します。 '?' 文字は任意の1文字と一致します。他のすべての文字はそれらの文字自身をあらわします。例えば、readme ファイル(readme
、read.me
や readme.txt
)に対応したテキストフィルタを作成したい場合は、ファイル名構成例として read*
を指定してください。
エンコードの指定が必須なファイル形式は限られています。エンコードを特に指定しないファイル形式の場合、その名前に対応した拡張子を用いる場合と同じエンコードが使用されます。例えば、デフォルトの .txt
ファイルは、OSのデフォルトエンコードが使用されます。原文ファイルのエンコードを、ファイル名構成例によって変更することもできます。このようなファイルは、どんなエンコードで出力させることも可能です。デフォルトでは、訳文ファイルのエンコードは、原文ファイルと同じになります。原文ファイルと訳文ファイルのエンコードを指定する項目では、対応したすべてのエンコードから選択できるコンボボックスが使用できます。<自動> は、OmegaT に自動的に判断させます。判断のしかたは以下の通りです:
原文ファイルの内部にあるエンコード宣言の部分を探します。(HTML ファイル、 XML ベースのファイルの場合)
いくつかのファイル( Java properties など)に対しては、そのファイルに必須のエンコードを設定します。
テキストファイルにはOSデフォルトのエンコードを使用します。
翻訳するファイル名を自動的に変更したい時があると思います。例えば、ファイル名のあとに言語コードを追加したい場合などです。訳文ファイル名構成例は特別な文法で記述されています。これを編集したい場合は、 編集... をクリックして構成例変更ダイアログを使用してください。編集内容をそのフィルタの初期値に戻したい時は、 初期値 をクリックしてください。ファイルフィルタダイアログの中で、訳文ファイル名構成例を直接編集することもできます。構成例変更ダイアログでは、以下のような変数を使用できます:
デフォルトは ${filename}
です。 -- 拡張子を持った完全な原文ファイル名で、訳文ファイル名は原文ファイル名と同じになります。
${nameOnly}
-- 拡張子なしの原文ファイル名です。
${extension}
-- 原文ファイルの拡張子のみです。
${targetLocale}
-- 訳文の地域コードです。( "xx_YY" の形式)
${targetLanguage}
-- 訳文の言語と国コードを合わせたものです。( "XX-YY" の形式)
${targetLanguageCode}
-- 訳文の言語のみ( "XX" )
${targetCoutryCode}
-- 訳文の国コードのみ( "YY" )
法律上の表示 | ホーム | 索引 |