Az egyszerű szöveges állományok legtöbbször .txt
kiterjesztésű, kizárólag szöveges információt tartalmaznak. Az egyszerű szöveges állományokban nincs egyértelmű utasítás a számítógép számára arra vonatkozóan, hogy milyen nyelven íródtak. Ez nagyjából azt jelenti, hogy a számítógép abból indul ki, hogy a szöveg nyelve a számítógép alapbeállítása szerinti nyelvvel megegyezik.
Egy orosz felhasználó esetén a számítógép nagy valószínűséggel szintén oroszul működik: a menük oroszul vannak, a megnyíló állományok nyelve is orosz stb. Legtöbbször a számítógép helyes feltételezésből indul ki, mivel a nyelvi környezet minden eleme orosz megjelenítést kíván.
Ha egy orosz fordító japán állományokat kap fordításra egyszerű szöveg formában, ezeket a gép orosznak fogja tekinteni. Ennek az az oka, hogy az állományban nincs utasítás a számítógép részére arról, hogy a szöveg milyen nyelven íródott. A japán állomány tartalma lehet pl. a következő:
OmegaTとは、コンピュータを利用した翻訳ツールです。
Mivel orosz tartalmat feltételez, ez a szövegszerkesztőben ekként jelenik meg:
OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≈ВЈБB
Ez azonban korántsem orosz, itt a japán karakterek helyén hibásan orosz betűk láthatók.
A többi alkalmazáshoz hasonlóan ez gondot okoz az OmegaT-nek is. Mindössze annyit feltételezhet, hogy alaphelyzetben az egyszerű szöveges állományok a rendszer alapbeállításával megjeleníthetők. Ez nem jelent gondot, ha francia gépen kell a szöveget lefordítani angolra, vagy német gépen kell megnyitni olasz állományokat.
Miért működik jól az angol és a francia esetén, és miért gond az orosz vagy a japán? Azért, mert az angol és a francia azonos karakterkészletet használ. Éspedig a Latin-1-et vagy annak egy változatát. Egészen mostanáig az orosz és a japán nyelv eltérő karakterkészleteket használt. Az orosz karakterek nem feleltek meg a japánoknak, és fordítva. Ennek eredménye látható fent.
A japán megbízó japán gépen dolgozik és japán szöveges állományokat hoz létre. Az ügyfél által kiválasztott karakterkészlet az operációs rendszertől és egyéb beállításoktól függ, de bizonyára a kiválasztott (japán) karakterkészlet nem jelenik meg helyesen az orosz számítógépen.
Az, hogy egy karakterkészletben az adott szöveg fizikailag miként jelenik meg (vagyis a számítógép miként olvassa azt be és jeleníti meg), a kódolástól függ. Amikor a számítógép beolvassa az állományt, a kódolásnak megfelelően "dekódolja" az információt és a karakterkészletnek megfelelően jeleníti meg. Alapvetően egy kódolás egy karakterkészletnek felel meg...
A helyzet kezelésére az OmegaT három alapvető megoldást kínál. Ezek mindegyike az állományszűrők alkalmazását feltételezi a Beállítások menüben .
.txt
kiterjesztésűeknek a kódolását az Egyszerű szövegek párbeszédablakban az állományszűrők alatt, éspedig úgy, hogy módosítja a Forrásállomány kódolását <auto>-ról arra az értékre, amelyik megfelel .txt
kiterjesztésű forrásállományának..txt
-ről .jp
-re): Az Egyszerű szövegek párbeszédablakban az állományszűrők alatt vegyen fel egy új névmintát a forrásállományhoz (például *.jp)
és válassza ki a megfelelő kódolásokat a forrásnyelvhez és a célnyelvhez..txt
-ről .utf8
-ra. Az OmegaT az állományt UTF-8 kódolású állományként fogja kezelni.Az OmegaT alaphelyzetben az alábbi lehetőségeket kínálja fel az egyszerű szövegek kezeléséhez:
.txt
szövegeket az OmegaT automatikusan (auto) a számítógép alapbeállítás szerinti kódolásának megfelelően értelmezi..txt1
állományokat az OmegaT ISO-8859-1 kódolásúnak tekinti (ez a kódolás lefedi a legtöbb nyugat-európai nyelvet)..txt2
állományokat az OmegaT ISO-8859-2 kódolásúnak tekinti (ez a kódolás lefedi a legtöbb közép- és kelet-európai nyelvet)..utf8
állományokat az OmegaT UTF-8 kódolásúnak tekinti (ez a kódolás lefedi csaknem a világ összes nyelvét).Ellenőrizheti a beállítást, ha az Állományszűrők pontra kattint a Beállítások menüben. Ha például cseh szöveggel van dolga (amely feltehetőleg ISO-8859-2 kódolású), akkor mindössze annyi a dolga, hogy a .txt
-kiterjesztést .txt2
-kiterjesztésre módosítja, melynek eredményeként az OmegaT annak tartalmát helyesen fogja értelmezni. Ha pedig teljesen biztosra akar menni, alakítsa át az efféle állományokat unikódba, azaz .utf8 állományformára.
Jogi tudnivalók | Kezdőoldal | Tartalomjegyzék |