Werken met opgemaakte teksten

Opmaakinformatie die aanwezig is in het bronbestand moet meestal worden gereproduceerd in het doelbestand. De in-regelige opmaakinformatie van ondersteunde formaten (momenteel DocBook, HTML, XHTML, Open Document en OpenOffice.org) wordt door OmegaT weergegeven als tags. In normale gevallen worden tags genegeerd bij het bepalen van de gelijkheid tussen de verschillende teksten voor overeenkomst-doeleinden. Tags die zijn gereproduceerd in het vertaalde segment zullen aanwezig zijn in het vertaalde document.


Tags voor opmaak

Namen van tags: De tags bestaan uit één tot drie tekens en een getal. Met unieke nummers kunnen de tags die met elkaar overeenkomen worden gegroepeerd en onderscheiden zich van de tags die dezelfde tekencombinatie hebben, maar in feite verschillend zijn. De tekens kunnen wel of niet de waarde vertegenwoordigen van de opmaak die de tag vertegenwoordigt (bijv.: vet, cursief, etc.)

Nummeren van tags:Tags worden op een oplopende manier genummerd door een tag-groep. Wat wij hier "tag-groepen" noemen is of één enkele tag (zoals <br1>) op zichzelf, of 2 tags die een paar vormen (zoals <i0> en </i0>). Binnen een segment krijgt de eerste groep (paar of enkele) het nummer 0, de tweede het nummer 1 etc. Het eerste voorbeeld hieronder heeft 3 tag-groepen (een paar, een enkele en dan nog een ander paar), het tweede voorbeeld heeft slechts één groep (een paar).

Paren en enkelen:Tags bestaan altijd of als enkele of als paar. Enkele tags geven opmaakinformatie aan die niet van invloed is op de tekst er omheen (extra spatie of regeleinde bijvoorbeeld).

 <segment 2132><b0><Ctrl+N></b0>, <br1><b2><Enter></b2><einde segment>

<br1> is een enkele tag en heeft geen effect op de omringende tekst. Tagparen geven gewoonlijk stijlinformatie weer die van toepassing is op de tekst tussen de openingstag en de sluitingstag van een paar. Wat er ook gebeurt met een paar, de openingstag moet altijd vóór de sluitingstag staan.

 <segment 3167>Logbestand (<b0>log.txt</b0>) voor het opsporen van bewerkingen en fouten.<einde segment>

<b0> en </b0> zijn een paar en hebben effect op de tekst log.txt.


Tags en zin-segmentatie

OmegaT maakt zijn tags voordat zin-segmentatie wordt toegepast. Afhankelijk van de segmentatieregels zou het kunnen lijken dat tags geen rekening houden met de hierboven genoemde regels van nummeren en groeperen. Controleer de volgende tekst: "Vóór: \. Na: \s". Men zou de segmentatie als volgt verwachten(<b0> en </b0> staan voor het begin en einde van cursief):

 <segment ....> <b0>Vóór: \. Na: \s</b0><einde segment>

Als echter de standaard segmentatieregels op dit segment worden toegepast (het standaard OmegaT-gedrag) krijgen we het volgende resultaat:

 <segment 1990> <b0>Vóór: \. <einde segment>
<segment 1991> Na: \s</b0><einde segment>

Toepassen van de regel segment na een punt gevolgd door een spatie splitst de originele tekst in twee segmenten, zelfs als de twee tags <b0> en </b0> bij elkaar zouden moeten zijn gehouden in hetzelfde segment. In sommige gevallen kan dat zelfs problemen geven in de vertaling, als tags moeten worden verplaatst in de doeltaal om de woordvolgorde van die taal weer te geven (zie Tag-bewerkingen hieronder).


Tag-bewerkingen

Voorzichtigheid is geboden met tags. Als zij per ongeluk worden gewijzigd kan de opmaak van het uiteindelijke document corrupt worden. De juiste benadering is "Repareer niets wat niet stuk is". Het is echter toch goed om te weten wat mogelijk is en hoe dat te doen.

Dupliceren van tag-groepen: Kopieer ze simpelweg naar de positie van uw keuze om tag-groepen te dupliceren. Onthoud dat in een paar de openingstag vóór de sluitingstag moet komen. De opmaak die wordt vertegenwoordigd door de groep die u dupliceerde zal worden toegepast op de sectie waar u het duplicaat plaatste.

Voorbeeld:

 <segment 0001><b0>Deze opmaak</b0> wordt hier gedupliceerd.<einde segment>

Na het dupliceren:

 <segment 0001><b0>Deze opmaak</b0> is <b0>hier gedupliceerd</b0>.<einde segment>

Verwijderen van tag-groepen:Verwijder ze eenvoudigweg uit het segment om tag-groepen te verwijderen. Onthoud dat van een paar zowel de openings- als de sluitingstag moet worden verwijderd om er voor te zorgen dat alle sporen van de opmaak correct worden uitgewist, anders zou het vertaalde bestand mogelijk beschadigd kunnen raken. Door een tag-groep te verwijderen verwijdert u de gerelateerde opmaak uit het vertaalde document.

Voorbeeld:

 <segment 0001><b0>Deze opmaak</b0> zal worden verwijderd.<einde segment>

Na het verwijderen:

 <segment 0001>Deze opmaak is verwijderd.<einde segment>

Aanpassen van de volgorde van tag-groepen:Plaats eenvoudigweg de tag-groep waar die zou moeten staan in de vertaling om de volgorde van een tag-groep te wijzigen om een andere taalstructuur in de vertaling weer te geven. De opmaak zal het gedeelte volgen waarop het is toegepast.

Voorbeeld:

 <segment 0001><b0>Opmaak nul</b0> en <b1>opmaak een</b1> worden omgedraaid.<einde segment>

Na wijziging van de volgorde:

 <segment 0001><b1>Opmaak een</b1> en <b0>opmaak nul</b0> zijn omgedraaid.<einde segment>

Tag-groep nesten

Wijzigen van de volgorde van een tag-groep kan resulteren in het nesten van een tag-groep binnen een andere tag-groep. Dit is prima zolang de omsluitende groep in zijn geheel de omsloten groep bevat. Met andere woorden, zorg er bij het verplaatsen van tagparen voor dat zowel de openings- als de sluitingstag in het doel worden verplaatst, anders zou het vertaalde bestand mogelijk beschadigd kunnen zijn en niet willen openen. Op het geneste deel zullen dan beide opmaken worden toegepast.

Voorbeeld:

 <segment 0001><b0>Opmaak</b0> <b1>een</b1> zal worden genest binnen opmaak nul.<einde segment>

Na het nesten:

 <segment 0001><b0>Opmaak <b1>een</b1></b0> is genest binnen opmaak nul.<einde segment>

Tag-groep overlappen

Overlappen is het resultaat van slechte bewerkingen van tagparen en zullen zeker leiden tot beschadiging van de opmaak en soms tot het helemaal niet openen van het vertaalde document. Voorbeeld:

 <segment 0001><b0>Opmaak</b0> <b1>een</b1> wordt verminkt.<einde segment>

Na de slechte bewerking:

 <segment 0001><b0>Opmaak <b1>een</b0> </b1> is nu vreselijk verminkt.<einde segment>

Tag-groep validatie

De functie Tags valideren detecteert gewijzigde tags (of dat met opzet is gedaan of per ongeluk) en toont de betrokken segmenten. Het activeren van deze functie – door op Ctrl+T te drukken - zal een dialoogvenster openen waarin alle segmenten uit het bestand, waarvan wordt vermoed dat ze zijn verbroken of slechte tags zijn, worden getoond. Fouten in een vertaalde getagde tekst zijn vaak een probleem in OpenDocument of OpenOffice.org bestanden die niet willen openen wegens problemen met tags die zijn gemaakt gedurende het vertaalproces. Repareren van de tags en het opnieuw samenstellen van de doeldocumenten is eenvoudig met de functie Tags valideren. Het venster, dat wordt geopend door te drukken op Ctrl+T, heeft een kolom met 3 tabellen met een koppeling naar het segment, het originele segment en het doelsegment:


1 Een ander lettertype voor weergave kan worden geselecteerd via het dialoogvenster <b0>Lettertype weergeven</b0>. Open het via het menu-item <i1>Instellingen</i1> > <i2>Lettertype weergeven...</i2>. Het lettertype en de afmetingen kunnen worden gewijzigd in het dialoogvenster. 'n Mens kan 'n ander vertoonfont kies met die <b0>Vertoonfont</b0>-dialoogkassie. Kies <i1>Opstelling</i1> > Vertoonfont... op die kieslys. Die lettertipe én die lettergrootte kan met dié dialoogkassie verander word.

De tags worden vet blauw geaccentueerd voor eenvoudige vergelijking tussen de originele en de vertaalde inhoud. Klik op de koppeling om het segment in het venster Bewerken te activeren. Verbeter, indien nodig, de fout en druk op Ctrl+T om terug te keren naar het venster Tags valideren om andere fouten te corrigeren. Tag-fouten zijn tagbewerkingen in de vertaling die niet dezelfde tagvolgorde en nummering produceren als die in het originele segment. Sommige tagbewerkingen zijn noodzakelijk en zijn goedaardig, sommige zullen problemen veroorzaken als het vertaalde document wordt gemaakt.


Hints voor tagbeheer

Tags vertegenwoordigen meestal enige vorm van opmaak van de originele tekst. Vereenvoudigen van de opmaak van de originele tekst draagt enorm bij aan het verminderen van het aantal tags. Het gelijk maken van gebruikte lettertypen, lettertype-afmetingen, kleuren etc. zou, indien mogelijk, moeten worden overwogen, om het vertalen te vereenvoudigen en het verminderen van mogelijke fouten in tags. Kijk eens in de sectie Tag-bewerkingen om te zien wat er met tags gedaan kan worden. Onthoud dat, als u last heeft van de tags en de opmaak niet buitengewoon relevant is voor de huidige vertaling, het verwijderen van tags de eenvoudigste manier kan zijn om uit de problemen te geraken.

Als u de tags moet zien in OmegaT maar de meeste opmaak niet behoeft te behouden in het vertaalde document staat het u vrij om de tags niet op te nemen in het vertaalde document. Let in dit geval extra op de tagparen omdat het verwijderen van één deel van het paar, maar het vergeten te verwijderen van het andere, de opmaak van uw document zal beschadigen. Omdat tags in de tekst zelf zijn opgenomen, is het mogelijk om segmentatieregels te gebruiken om segmenten te maken met minder tags. Dit is een geavanceerde voorziening en enige ervaring is vereist om die juist toe te passen.

Belangrijk: OmegaT is nog niet in staat om fouten in de opmaak volautomatisch te detecteren, dus het zal geen signaal geven als u een fout maakt of de opmaak wijzigt zodat die beter bij uw doeltaal past. Soms zal uw vertaalde document er echter vervormd uitzien en, in geval van OpenDocument / OpenOffice.org-bestanden, zouden zelfs misschien weigeren te openen.


Tijdelijke aanduidingen voor printf

In sommige programmeertalen (bijv. PHP, C) worden speciale tags gebruikt als tijdelijke aanduidingen in tekenreeksen die in combinatie met de functie printf worden gebruikt. Bijv.:

$var =_("handig");
echo printf(_("OmegaT is erg %s"),$var);

Indien tekenreeksen van tekst uit deze broncode worden geëxtraheerd (bijv. via het PO-filter), vervangt OmegaT deze variabelen niet door tags, omdat het niet zeker weet of bijvoorbeeld. %s in feite een tijdelijke aanduiding is of alleen maar een gedeelte van een tekst. U kunt echter de validatie voor deze aanduidingen inschakelen. Selecteer Opties→ Tagvalidatie... uit het menu. U kunt kiezen uit eenvoudige of volledige validatie.

De officiële syntaxis voor variabelen van printf is

"%" [ARGUMENTSWAPSPECIFIER] [SIGNSPECIFIER] [PADDINGSPECIFIER] [ALIGNMENTSPECIFIER] [WIDTHSPECIFIER] [PRECISIONSPECIFIER] TYPESPECIFIER

Volledige validatie ondersteunt deze indeling volledig, met uitzondering van de WIDTHSPECIFIER. In eenvoudige validatie wordt de volgende syntaxis gecontroleerd:

"%" [ARGUMENTSWAPSPECIFIER] [PRECISIONSPECIFIER] TYPESPECIFIER

U kunt de volgorde van de aanduidingen wijzigen, maar dan moet u de ARGUMENTSWAPSPECIFIER toevoegen als die er nog niet staat. Dit betekent het toevoegen van een reeksnummer en een dollarteken na de %. Bijv. "%s is een %s toepassing" is gelijk aan "%1$s is een %2$s toepassing" die u kunt vertalen door "een %2$s toepassing is %1$s".


Auteursrechten Home Inhoudsopgave