整形されたテキストを扱う

通常、原文ファイルにある整形情報は、訳文ファイルにも同じく必要になります。対応しているフォーマット(現行のDocBook、HTML、XHTML、Open Document、OpenOffice.org)の行途中にある整形情報はOmegaTのなかでタグとして表示されます。参考文献を探すため異なる文字列間の類似度を調べる場合、通常、タグは考慮されません。翻訳した分節にあるタグは翻訳文書にも含まれます。


整形タグ

タグの名前:タグ名は1から3文字の文字と数字からなります。同じ数字で互いに対応するタグをまとめ、同じショートカット文字を持つタグを区別します。これらのショートカット文字はタグが示す整形情報(太字や斜体など)を表すこともあります。

タグの番号付け:タグに付けられる数字はタググループごとに増えていきます。ここで言う「タググループ」とは、<br1>のような単一タグ自身と、<i0></i0>のような二つのタグの組み合わせ(ペア)の両方のことを言います。分節のなかで最初のグループ(ペアもしくは単一)が数字0となり、次が1となります。以下の最初の例では、最初は3つのタググループ(単一、二つのペア)があり、2つめの例では1つのグループ(ペア)だけです。

単一とペア:タグは常に単一であるか、ペアになっています。単一タグは、タグの周囲にあるテキストには影響しない整形情報を示します(例えば、追加の空白や改行などです)。

 <分節 2132><b0><Ctr+N></b0><br1><b2><Enter></b2></分節>

<br1> が単一タグで、周囲のテキストには全く影響しません。通常、ペアになったタグは、開きタグと閉じタグの間に挟まれた文字列に適用される整形情報を示しています。開きタグは閉じタグの前に必ず現れます。

 <分節 3167>それらは <b0>tmx</b0> 形式である必要があります。</分節>

<b0> </b0>がペアになっており、tmx に作用しています。


タグと文の分節化

OmegaTでは、文の分節化が行われる前にタグを作成します。分節化のルールによっては、タグが上の番号付けのルールとグループ化のルールに従っていない形になっていることもあります。次のテキストをみてください "分節前の構成例:\. 分節後の構成例:\s". これは次のように、分節化されると思われるでしょう(ここでは、<b0> と </b0> は斜体の始まりと終わりを意味します)。

 <分節 ....> <b0>分節前の構成例:\. 分節後の構成例:\s</b0></分節>

しかし、デフォルトの分節化ルールが適用されると、次のような結果になります。

 <分節 1990> <b0>分節前の構成例:\. </分節>
<分節 1991> 分節前の構成例:\s</b0></分節>

ピリオドの後の分節は空白まで続くというルールを適用すると、<b0></b0>は同じ分節になければならないのに、もとのテキストは2つのセグメントに分かれてしまいます。訳文の言語の語順を反映させるため、訳文のなかでタグを異なる位置に置かなければならない場合、訳文で問題が発生することがあります(次のタグ操作参照)。


タグ操作

タグを操作する場合には細心の注意が必要です。もし誤って変更してしまうと、最終的なファイルの整形が壊れてしまうかもしれません。最善の方法は、「壊れていないモノは直すな」です。しかしながら、タグ操作で可能なこととその方法を知っておいた方がよいでしょう。

タググループの複製:タググループを複製するには、単に好きな場所にコピーするだけです。タグがペアになっているタググループでは、開きタグは閉じタグの前になければならないということを忘れないでください。複製したグループをおいた場所が整形されます。

例:

 <分節 0001><b0>この見映え設定は</b0>ここでも適用させましょう。</分節>

複製後:

 <分節0001><b0>この見映え設定は</b0>ここで<b0>適用された</b0></分節>

タググループの削除:タググループを削除するには、分節から取り除けばいいだけです。ペアになっているタググループでは、整形情報を適切に削除するため、開きタグと閉じタグの両方を削除しないければならないことに注意してください。さもなければ訳文ファイルが壊れてしまう場合があります。タググループを削除することで、関連する整形情報が訳文ファイルから削除されます。

例:

 <分節 0001><b0>この見映え設定は</b0>削除されます。</分節>

削除後:

 <分節 0001>先の見映え設定は削除されました。</分節>

タググループの順序変更:翻訳において、言語構造の差異を反映させるためにタググループの順序を変更するには、翻訳文のなかで必要な場所にタググループを置くだけです。タググループが適用された箇所に従い整形されます。

例:

 <分節 0001><b0>見映え設定0番</b0><b1>見映え設定1番</b1> を逆にしましょう。</分節>

順序変更後:

 <分節 0001><b1>見映え設定1番</b1><b0>見映え設定0番</b0> は逆になりました。</分節>

タググループの入れ子

タググループの順序を変更することで、タググループが他のタググループのなかに入れ子になることがあります。この場合、外側のタググループが内側のタググループを完全に囲む限り問題ありません。言いかえると、ペアになったタグを動かす場合、開きタグと閉じタグの両方が行き先のタググループのなかに収まればよいのです。そうでない場合は、翻訳ファイルが壊れてしまい開かない可能性もあります。入れ子になった部分は、両方の整形が適用されます。

例:

 <分節 0001><b0>見映え設定</b0> <b1>1番</b1> は見映え設定0番の入れ子にしましょう。</分節>

入れ子になった後:

 <分節 0001><b0>見映え設定<b1>1番</b1></b0> は見映え設定0番の入れ子になりました。</分節>

タググループの重なり

誤った操作の結果、複数のタグペアで囲まれた箇所が(入れ子ではなく)一部重なってしまうと確実に翻訳ファイルの整形が壊れてしまい、場合によっては翻訳ファイルが全く開かなります。例:

 <分節 0001><b0>見映え設定</b0> <b1>1番</b1> 大変なことになります!</分節>

誤った操作後:

 <分節 0001><b0>見映え設定 <b1>1番</b0> </b1>は大変なことになりました!</分節>

タググループの検証

タグ検証機能は、(故意か過失かによらず)変更されたタグを検知し、影響のあるセグメントを表示します。[Ctrl+T] でこの機能を使用できます。表示されたウィンドウには、翻訳のなかで壊れたもしくは誤ったタグと疑われるものが表示されます。OpenDocument や OpenOffice.org のファイルでは、翻訳途中で発生したタグの問題により開けなくなるので、翻訳された整形文書のバグはしばしば問題になります。タグ検証機能により、タグの修正と翻訳文書の再生成が簡単にできます。Ctrl+Tにより表示されるウインドウには3列の表があり、それぞれ分節へのリンク、原文の分節、訳文の分節です。


1 <b0>Formatting</b0> <b1>one</b1> is going to be messed up.    <b0>見映え設定<b1>1番</b0>は大変なことになりました!</b1>  

原文と訳文で比較しやすいよう、タグは青い太字で強調表示されます。分節番号をクリックすると、エディタにその分節を表示できます。必要に応じて訳文を修正し、Ctrl+T を押すと再度タグ検証ウィンドウに戻り、その他のエラーを表示します。˜タグ エラーは、タグ操作によって、原文の分節にあるタグの登場順序や数が、訳文と一致しない場合におこります。タグ操作の中には、必要なもの、行っても問題ないものもありますが、翻訳後の文書を作成した際に問題となるものもあります。


タグ管理についてのヒント

タグがあるということは、多くの場合、ある種のフォーマット・整形がそこで行われているということを表します。原文テキストの形式を単純にしておくと、文書全体のタグ数の減少につながります。もし可能であれば、文書中で使用する字体の種類、サイズ、色などをなるべく統一しておくと、翻訳作業を単純化でき、起こりうるタグ関連のエラーを減らすことができます。タグに対してどういった操作が可能かタグ操作セクションを見てください。もし、タグの取り扱いが面倒な場合や整形が翻訳内容にそれほど影響しないときは、訳文にタグを付けないことが、もっとも簡単な解決策になりうることを忘れないでください。

OmegaTのなかでタグを確認する必要はあるが、翻訳文書のなかに整形情報を含む必要があまりないのであれば、翻訳にタグを含む必要はありません。この場合、ペアになっているタグには特に注意を払ってください。 片方のタグだけ削除してしまうと文書の整形情報が壊れてしまうからです。タグはテキストの中に含まれているので、分節化規則を使ってタグの少ない分節を生成することが可能です。これは進んだ機能であり、うまく使いこなすには経験が必要です。

重要: OmegaTでは整形に関する誤りをすべて自動で見つだすことはまだできませんので、何か間違いがあった場合や、訳文言語にあうよう整形情報を変えたとしてもOmegaTが何か促すことはありません。しかしながら、OpenDocumentかOpenOffice.orgのファイルで訳文ファイルが何かおかしい場合は、ファイルを開くことができないことがあります。


法律上の表示 ホーム 索引