翻訳メモリ


OmegaT と TMX ファイル

TMX ファイル − 場所と目的

OmegaT は異なる 3 つの場所にある TMX ファイルを使用します。

必要に応じて、プロジェクト内の翻訳可能な全分節を含む TMX ファイル(OmegaT 形式)を、指定した場所に作成することもできます。疑似翻訳メモリ の項を参照してください。

TMX ファイルのバックアップ

OmegaT は、翻訳作業中の全ての翻訳内容をプロジェクト内の omegat フォルダーに蓄積していきます。

また OmegaT は、プロジェクトが開かれたり、再読み込みされたりするたびに、同じフォルダーに project_save.tmx.YEARMMDDHHNN.bak としてバックアップファイルを保存します。その翻訳メモリが保存された日時をファイル名末尾に加えます。(YEAR は 4 桁の年、 MMDD は月日、HHNN は時刻)

もし翻訳中のデータを失ってしまったと気づいた場合、以下の手順に従ってください。これにより、直前に保存された状態(多くの場合、最後の修正から 10 分以内)に、プロジェクトを修復できます:

  1. プロジェクトを閉じる
  2. 現在の project_save.tmx ファイルの名前を一時的に変更する(たとえば project_save.tmx.temporary
  3. 探している内容ともっとも近い翻訳メモリのバックアップファイルを選択する
  4. そのファイル名を project_save.tmx と変更する
  5. プロジェクトを再度開く

TMX ファイルと言語

TMX ファイルには、ある同じ分節に対し、複数の異なる言語で表記された 翻訳対 が含まれています。翻訳対は、少なくとも 2 つの翻訳対差異(tuv)からできています。そのうちいずれかが、原文または訳文に使用されます。

プロジェクトの設定により、それぞれどちらが原文の言語で、どちらが訳文の言語であるかを指定します。OmegaT は、プロジェクトの原文言語に対応する 翻訳対差異 を原文の分節として扱い、訳文言語に対応する 翻訳対差異 を訳文の分節として扱います。OmegaT はその指定に以下の 2 通りのような標準的な表記を使用します:

言語コードと国コードについては 使用言語と言語コード に例示しています。

プロジェクトの言語コードと TMX の言語コードが完全に一致する場合、分節はメモリに読み込まれます。言語コードのみが一致し、国コードは一致しない場合も、分節はメモリに読み込まれます。言語コードと国コードいずれも一致しない場合は、分節はメモリに読み込まれません。


OmegaT はどのように翻訳内容を記憶するのか

project_save.tmx ファイルには、プロジェクトを開始してから翻訳された全ての分節が含まれています。たとえば、そのプロジェクトの分節に何らかの変更を加えた場合、 project_save.tmx に新しい翻訳のペア(※訳注=その分節に対応する原文と訳文)を記録しますが、既存の情報も保持します。

これにより、まれに参考訳文ウィンドウに 孤立した文字列 が表示されることがあります。この参考訳文は、既に存在しないが、修正される前に記録された分節を参照しています。その変更が間違いだった場合、過去の状態に戻すことで以前の記録が再度表示されるようになります。


過去のプロジェクトの翻訳メモリを使用する

OmegaT プロジェクト内で訳文文書を作成すると、プロジェクトの翻訳メモリは、そのプロジェクトフォルダに3つのファイルとして出力されます。(詳細は、上述した部分を参照ください)これら 3 つの TMX ファイル( " -omegat.tmx "、" -level1.tmx"、"-level2.tmx")を「エクスポートした翻訳メモリ」として、つまり現在のプロジェクトについて外部出力した2言語での要約として、扱うことができます。

過去のプロジェクトで使用した翻訳メモリを再利用したいとき(例えば、今度作成する新しいプロジェクトが「過去のものと非常に似ている」または「以前に使用したかもしれない専門用語を含んでいる」というような場合など)、この翻訳メモリを「入力用翻訳メモリ」として、新しいプロジェクトにインポートできます。この場合は、使用したい翻訳メモリを新しいプロジェクトの tm フォルダーへ置いてください。

デフォルトでは、 tm フォルダーはプロジェクトのルートフォルダーの下にあります。(つまり /MyProject/tm )しかし必要であれば、プロジェクトの設定でその位置を変えてもかまいません。これは、過去に作成した翻訳メモリを何度も使用するような場合に便利です。たとえば、同じ顧客向けであったり、同じ分野の翻訳であったりする場合が挙げられます。この場合、使いやすい手順は以下の通りです:

ご注意点:OmegaT 起動時には tm フォルダーにある全ての TMX ファイルが読み込まれるので、持っている全ての TMX ファイルをそこに置いておくと、不必要に起動を遅くしてしまう場合があります。いったん現在のプロジェクトの project_save.tmx に移し替えたあとは、本当に必要なものだけを退避しておく(例えば tm フォルダに残しておいて、拡張子だけ変更するなど)のもよいでしょう。

他の翻訳ツールで作成された翻訳メモリを使用する

ファイルのインポート

OmegaT は TMX バージョン 1.1 から 1.4b (レベル 1 と レベル 2 の両方)をインポートすることができます。これにより、他のツールで作成された翻訳メモリを、OmegaT で読み込むことができます。しかし、OmegaTはレベル 2 の(文書情報だけでなく、フォーマット情報も含む) TMX ファイルに完全には対応しておらず、参考訳文の一致率が若干下がってしまう可能性があります。

インポートしたファイルの取り扱い

OmegaT が翻訳メモリファイル(TMX ファイル)を取り扱う際には、非常に厳密な処理が行われます。ファイル中に何か誤りが見つかった場合、そのファイルは読み込まれません。

一部で、正しくない TMX ファイルを生成してしまうツールがあることが確認されています。そのような翻訳メモリを OmegaT に参照させたいときに、 そのファイルを読み込めない場合があります。その場合は、修正を行う必要があります。修正は簡単な操作で行えることが多く、OmegaT は関連するエラーメッセージを表示して情報を与えてくれます。不明な点があれば ユーザーグループ に問い合わせてください。


OmegaT の翻訳メモリを他の翻訳ツールで使用する

OmegaT は(レベル 1、レベル 2 とも)バージョン 1.4 の TMX ファイルを出力します。出力されたレベル 2 TMXファイルは、標準のレベル 2 形式ではありませんが、TMX レベル 2 に対応した翻訳ツールで適切に使用できる参考訳文を生成できます。もし、文書情報のみが必要な場合(フォーマット情報が必要でない場合)は、OmegaT が作成したレベル 1 ファイルを使用してください。


疑似(Pseudo)翻訳メモリ

OmegaT が作成する翻訳メモリに対して、分節に対する前処理や、何らかの別処理を加えたい場合があるかもしれません。例えば、テストのために疑似的な翻訳を行いたいような場合です。

OmegaT は、プロジェクトの全ての分節を含む、別の TMX ファイルを作成することができます。この TMX ファイル中の翻訳内容は以下のいずれかです:

この TMX ファイルには任意の名称を付けることができます。拡張子は、何も指定しなかった場合「.tmx」が付加されます。

このファイルの作成は、コンソールモードで行えます。詳細は コンソールモード を参照してください。

作成した TMX ファイルは、任意のツールで処理することができます。これを OmegaT で再利用するには:
ファイル名を project_save.tmx と変更し、プロジェクトフォルダーにある omegat フォルダーに置いてください。


翻訳メモリの更新

以前のバージョンの OmegaT は、段落単位でしか原文を分節化できず、また HTML と Open Document ファイルに対しては、フォーマットタグに対する番号付けが適切に行えない場合がありました。OmegaT 2.0 では、参考訳文の品質を向上し、既に存在する翻訳内容をより活用するため、このような TMX ファイルをその場で検出し、更新できます。− つまりもうこの手動の繰り返し作業は必要なくなります。

プロジェクトの TMX は 1 度だけ更新され、更新後の形式で書き込まれます。以前の TMX ファイルは、プロジェクトが読み込まれるたびにその場で更新されます。OmegaT 2.0 ではファイルフィルターに変更が加えられたため、分節化の内容が全く異なるものになる可能性があります。ごくまれに、翻訳メモリを手動で更新していく必要があることにもご注意ください。


法律上の表示 ホーム 索引