Настройки импорта файла

.HTML (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Содержимое тега исходного файла можно визуализировать в редакторе, нажав Развернуть теги под заголовком Теги в меню Редактировать и отредактировать, нажав F2.

Важно

Проблемы с тегами являются распространенной причиной ошибок экспорта. Всегда убедитесь, что теги и форматирование правильные перед экспортом файлов, проведя проверки контроля качества.

Все элементы имеют как минимум следующие переводимые атрибуты: title, aria-label, aria-valuetext.

Нестандартные html теги:

  • игнорируются - отдельные абзацы создаются, когда Преобразовать нестандартные HTML теги в теги Фраз установлено в false.

    • Стандартные игнорируемые html теги: base, basefont, canvas, colgroup, frameset, link, object, script, style

  • Импортируются как одиночные (непереводимые) встроенные теги, когда Преобразовать нестандартные HTML теги в теги Фраз истинно

Некоторые элементы имеют больше атрибутов: <img> имеет alt, но <a> не имеет, так как alt не является стандартным атрибутом для <a>

Смотрите справочный файл HTML элементов для стандартных атрибутов и использования HTML сущностей.

Типы файлов

  • .HTML

  • .HTM

Параметры импорта

  • Тег разрыва (<br/>) создает новый сегмент

  • Преобразовать нестандартные HTML теги в теги Фраз

    Преобразует теги, которые не определены как HTML. Если есть недопустимые теги, система пропускает их и обрабатывает остальные.

    Примеры:

    <html> Тест простой <unknown/>html.</html>

    Не-HTML теги будут обработаны как теги Phrase и импортированы как Тест простой {1}html.

    <html> Тест простой <% unknown %>html.</html>

    Недопустимая переменная (<% unknown %>) приводит к сбою парсинга. Сломанная часть будет рассматриваться как непереводимая, и редактор покажет Тест простой, html.

  • Импорт комментариев

    Импортирует отдельные комментарии как теги. Встраиваемые комментарии (внутри абзацев) всегда импортируются как теги.

  • Не удалять пробелы

    Сохраняет ту же структуру пробелов в целевом документе (например, пробелы, переносы строк и т.д.).

  • Обновить декларацию языка в завершенных файлах

    Все декларации языка в завершенных HTML файлах обновляются с правильным языковым кодом.

  • Отключить экранирование сущностей

    Отключает экранирование < и & сущностей в завершенных файлах.

  • Исключить элементы

    Список HTML тегов, разделенных запятыми, которые не должны импортироваться для перевода.

  • Преобразовать в теги системы Phrase TMS 

    Применить регулярные выражения, чтобы преобразовать указанный текст в теги.

  • Преобразовать HTML символы сущностей в теги системы Phrase TMS

    Введите список символов, которые будут преобразованы в теги во время перевода. Они экспортируются в переведенный документ в той же форме, в которой они присутствуют в исходном файле.

    Пример:

    если &nbsp; преобразуется в тег Phrase, тот же элемент (&nbsp;) будет сохранен в экспортированном документе.

  • Переводимые метатеги

    • Автоматическое обнаружение доступно только для <meta> тегов с атрибутом name="description" или name="keywords" и attributes="property".

    • Используйте регулярное выражение, чтобы указать атрибуты в <meta> тегах для импорта их содержимого. В качестве примера используйте (?:pan-keywords), чтобы импортировать метатеги с атрибутом name="pan-keywords".

  • Переводимые атрибуты

    Список HTML тегов, разделенных запятыми, которые указывают на переводимые атрибуты.

  • Непереводимые встроенные элементы

    Список HTML тегов, разделенных запятыми, которые указывают на непереводимые встроенные элементы.

  • Переводимые встроенные элементы

    Список HTML тегов, разделенных запятыми, которые указывают на переводимые встроенные элементы.

  • Заполнители сегментации для HTML тегов

    Настройте внутренние символы заполнителей, используемые HTML подфильтром во время сегментации. Эти заполнители представляют открытые, закрытые и одиночные HTML теги внутри, чтобы правила SRX сегментации могли их идентифицировать.

    Изменения влияют на сегментацию только в том случае, если правила SRX явно ссылаются на эти символы. Это может изменить использование памяти переводов (TM) для новых импортов.

    Принятые форматы ввода:

    • Точка кода Unicode в формате U+XXXX (например, U+E7FD)

    • Простой символ, вставленный непосредственно в поле (например, ␢)

    Если любое из трех полей остается пустым, используются значения по умолчанию для соответствующего заполнителя:

    • Заполнитель тега начала сегментации: U+E7FD

    • Заполнитель тега закрытия сегментации: U+E7FE

    • Заполнитель единственного тега сегментации: U+E7FF

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.