Работа с форматированными текстами

Информация о форматировании в исходном файле обычно должна быть воспроизведена в итоговом файле перевода. Информация о форматировании в поддерживаемых файлах (в настоящее время DocBook, HTML, XHTML, Open Document и OpenOffice.org) представлена в OmegaT тэгами. В большинстве случаев тэги игнорируются при оценке схожести текстов для подбора совпадений. Тэги, которые воспроизведены в переведённом сегменте, будут перенесены в переведённый документ.


Тэги форматирования

Именование тэгов:: Тэги состоят из одного, двух или трёх символов и номера. Уникальный номер позволяет группировать тэги и различать те из них, которые отображены одинаковыми символами, но на самом деле различны. Символы не обязательно отражают значение форматирования, которое представляет данный тэг (например, жирный шрифт, курсив и т.д.)

Нумерация тэгов: Тэги нумеруются в порядке возрастания по группам тэгов. То, что мы называем «группой тэгов», является либо самостоятельным одиночным тэгом (например, <br1>), либо двумя тэгами, которые образуют пару (например, <i0> и </i0> ). Внутри сегмента первая группа (пара или одиночный тэг) получает номер 0, вторая - номер 1 и так далее. В первом примере ниже есть три группы тэгов (пара, одиночный тэг, затем снова пара), во втором примере только одна группа (пара).

Парные и одиночные тэги:Тэги всегда являются либо одиночными, либо парными. Одиночные тэги означают информацию о форматировании, которое не затрагивает окружающий текст (например, дополнительный пробел или разрыв строки).

 <сегмент 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><конец сегмента>

<br1> - это одиночный тэг, он не затрагивает текст вокруг себя. Парные тэги обычно означают информацию о стиле, который применяется к тексту между открывающим и закрывающим тэгами пары. Что бы ни случилось с парой, открывающий тэг всегда должен находиться перед закрывающим.

 <сегмент 3167>Файл (<b0>log.txt</b0>) предназначен для отслеживания операций и ошибок.<конец сегмента>

<b0> и </b0> являются парными и влияют на строку log.txt.


Тэги и сегментирование по предложениям

OmegaT создаёт свои тэги до того, как применяется сегментирование по предложениям. В зависимости от правил сегментирования, может показаться, что тэги иногда перестают соблюдать вышеперечисленные правила нумерации и группировки. Посмотрим на следующий текст: «Перед: \. После: \s». Можно было бы ожидать такого сегментирования (<b0> и </b0> означают начало и конец курсива):

 <сегмент ....> <b0>Перед: \. После: \s</b0><конец сегмента>

Однако, если к этому сегменту применить правила сегментирования по умолчанию, то получится следующий результат:

 <сегмент 1990> <b0>Перед: \. <конец сегмента>
<сегмент 1991> После: \s</b0><конец сегмента>

Применение правила начинать новый сегмент после точки и пробела разделяет исходный текст на два сегмента, даже если два тэга <b0> и </b0> должны быть вместе в одном сегменте. Иногда это может вызвать проблемы, когда нужно по-другому разместить тэги в переводе, чтобы отразить порядок слов языка перевода (см. ниже Операции с тэгами).


Операции с тэгами

С тэгами нужно обращаться осторожно. Если их случайно изменить, может быть нарушено форматирование конечного файла. Разумно будет практиковать подход «Не чини то, что не сломано». Тем не менее, полезно знать свои возможности и то, как их можно использовать.

Копирование групп тэгов: Чтобы дублировать группу тэгов, просто скопируйте их в желаемое место. Помните, что открывающий тэг всегда должен находиться перед закрывающим. Форматирование, представленное группой, которую вы дублировали, будет применено к тому месту, куда было произведено копирование.

Пример:

 <сегмент 0001><b0>Это форматирование</b0> будет применено здесь.<конец сегмента>

После копирования:

 <сегмент 0001><b0>Это форматирование</b0> было <b0>скопировано сюда</b0>.<конец сегмента>

Удаление групп тэгов: Чтобы удалить группу тэгов, просто уберите её из сегмента. Помните, что нужно удалить как открывающие, так и закрывающие тэги и убедиться, что все следы форматирования действительно стёрты. В противном случае созданный файл будет поврежден. Удаляя группу тэгов, вы удаляете соответствующее форматирование из переведённого файла.

Пример:

 <сегмент 0001><b0>Это форматирование</b0> будет удалено.<конец сегмента>

После удаления:

 <сегмент 0001>Это форматирование было удалено.<конец сегмента>

Изменение порядка групп тэгов: Чтобы переместить группу тэгов в соответствии с другой структурой языка перевода, просто передвиньте группу туда, где она должна находиться в переводе. Форматирование переместится туда же.

Пример:

 <сегмент 0001><b0>Форматирование ноль</b0> и <b1>форматирование один</b1> поменяются местами.<конец сегмента>

После изменений:

 <сегмент 0001><b1>Форматирование один</b1> и <b0>форматирование ноль</b0> поменялись местами.<конец сегмента>

Иерархия групп тэгов

Изменение групп тэгов может привести к тому, что одна группа будет вложена в другую. Это нормально, пока внешняя группа полностью окружает вложенную. Другими словами, при перемещении парных тэгов, всегда следите за тем, что и открывающий и закрывающий теги перенеслись в перевод. В ином случае переведённый файл может быть поврежден и перестать открываться. К вложенной части будут применены оба форматирования.

Пример:

 <сегмент 0001><b0>Форматирование</b0> <b1>один</b1> будет вложено внутрь форматирования ноль.<конец сегмента>

После вложения:

 <сегмент 0001><b0>Форматирование <b1>один</b1></b0> теперь вложено в форматирование ноль.<конец сегмента>

Перекрывающиеся группы тэгов

Перекрывание является результатом неправильных манипуляций с парами тэгов и практически всегда приводит к порче форматирования, а иногда и к тому, что переведённый файл перестаёт открываться вообще. Пример:

 <сегмент 0001><b0>Форматирование</b0> <b1>один</b1> сейчас испортится.<конец сегмента>

После некорректных манипуляций:

 <сегмент 0001><b0>Форматирование <b1>один</b0> </b1>успешно испорчено.<конец сегмента>

Проверка групп тэгов

Функция проверки тэгов определяет измененные (намеренно или случайно) тэги и показывает затронутые сегменты. Вызов этой функции - посредством нажатия Ctrl-T — откроет окно, в котором перечислены все сегменты, для которых есть подозрение на некорректную передачу тэгов в переводе. Ошибки при переводе файлов с тэгами часто вызывают проблемы с файлами OpenDocument или OpenOffice.org, поскольку их может быть невозможно открыть из-за проблем с тэгами, появившихся в процессе перевода. Исправить тэги и пересоздать файлы перевода вам поможет функция «Проверка тэгов». Это окно открывается по Ctrl-T и состоит из трёх столбцов со ссылкой на сегмент и с текстом оригинала и перевода:


1 A different display font can be selected via the <b0>Display Font</b0> dialog. Open it via the <i1>Settings</i1> > <i2>Display Font...</i2> menu item. The font type and size can be changed from the dialog. 'n Mens kan 'n ander vertoonfont kies met die <b0>Vertoonfont</b0>-dialoogkassie. Kies <i1>Opstelling</i1> > Vertoonfont... op die kieslys. Die lettertipe én die lettergrootte kan met dié dialoogkassie verander word.

Тэги выделены жирным шрифтом и синим цветом, чтобы можно было легко сравнить содержимое оригинала и перевода. Щелкните по ссылке, чтобы активировать сегмент в области редактирования. При необходимости исправьте ошибку и нажмите Ctrl+T, чтобы вернуться к окну проверки тэгов и исправить следующие ошибки. Ошибки тэгов - это манипуляции с тэгами, которые не воспроизводят в тексте перевода тот же порядок и количество тэгов, что в исходном сегменте. Некоторые изменения тэгов необходимы и с ними приходится мириться, другие вызовут проблемы после создания переведённого документа.


Подсказки по управлению тэгами

Обычно тэги несут какую-то информацию о форматировании исходного текста. Упрощение форматирования исходного текста уменьшает количество тэгов. Если это возможно, постарайтесь унифицировать используемые шрифты, размеры, цвета и т. п., так как это упрощает перевод и уменьшает количество возможных ошибок, связанных с тэгами. Прочитайте раздел Операции с тэгами, чтобы получить представление о том, что можно с ними делать. Имейте в виду, что если тэги вас раздражают, а форматирование не очень важно для текущего перевода, то удаление тэгов может стать решением проблемы.

Если вы хотите видеть тэги в OmegaT, но вам не нужно сохранять большую часть форматирования в переведённом документе, вы можете просто не добавлять тэги в перевод. В этом случае обратите особое внимание на пары тэгов, поскольку если вы удалите одну из частей пары, но забудете удалить другую, то испортите форматирование в переведенном документе. Поскольку тэги являются частью текста, вы можете использовать Правила сегментирования, чтобы создавать сегменты с меньшим количеством тэгов. Это дополнительная функция и для её правильного применения необходим опыт.

Важно: в настоящее время OmegaT не умеет полностью автоматически определять ошибки в форматировании, поэтому не отличает ошибок от изменений, сделанных в рамках адаптации оформления под язык перевода. Однако, иногда в переведенном файле может быть нарушено форматирование, а в случае с файлами OpenDocument / OpenOffice.org — файл может оказаться поврежден и его евозможно будет открыть.


Авторские права Наверх Предметный указатель