Управление проектом

Segmentation Rules (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Сегментация

Сегментация — это разделение текстов оригинала на меньшие части. Это улучшает поиск ранее переведенного текста в памяти переводов. Сегменты отображаются в редакторе и могут быть фильтрованы.

Правила сегментации по умолчанию соответствуют специфике каждого поддерживаемого языка и могут быть настроены.

Задания, импортированные с ошибками сегментации, такими как плохо форматированные файлы документов или неправильная настройка сегментации, могут повлиять на значения совпадений в памяти переводов (TM).

Пример:

Хорошая сегментация:

  • Поддерживаются базы памяти переводов с многоязычными языками перевода и могут использоваться двунаправленно.

    Значение совпадения 100%.

Плохая сегментация:

  • Поддерживаются базы памяти переводов с многоязычными языками перевода.

    Значение совпадения 100%.

  • и могут использоваться двунаправленно.

    Значение совпадения 63%.

Настроить правила сегментации

К заданиям и шаблонам проектов можно применять индивидуальные правила сегментации. Если проект требует индивидуального правила сегментации, для этого проекта необходимо создать шаблон. При установке в качестве основного ко всем новым заданиям, импортируемым для этого языка оригинала, применяются настраиваемые правила сегментации.

Существует два типа правил сегментации:

  • Сокращения в файле .XLSX

  • Регулярное выражение файлов .SRX

Чтобы использовать настроенные правила, скачайте правила по умолчанию, измените их, загрузите измененный файл, а затем примените их к указанным заданиям.

Осторожно

При добавлении правил пользовательской сегментации для языка оригинала CJK без каталога (в то время как язык перевода будет использовать пробелы в качестве разделителя слов) обеспечьте добавление пробелов в начале или в конце сегментов перевода, разделенных пользовательским правилом; это разграничивает слова в переводе. Обычно это автоматически применяется к сегментам, созданным правилами сегментации по умолчанию, так как пробелы не добавлены в разделенных вручную сегментах или сегментах, образованных дополнительными пользовательскими правилами сегментации.

Скачать Правила сегментации по умолчанию

Чтобы скачать правила сегментации по умолчанию, выполните следующие действия:

  1. На странице «Настройки Setup_gear.png» прокрутите вниз раздел «Настройки проекта» и нажмите «Сегментация».

    Открывается страница сегментации.

  2. Выберите настраиваемый язык и нажмите Экспортировать XLSX/SRX.

    Откроется окно Экспортировать XLSX/SRX.

  3. Выберите формат:

    • XLSX содержит список сокращений.

    • SRX содержит правила регулярного выражения.

  4. Выберите язык в раскрывающемся списке.

  5. Нажмите Скачать.

    Файл загружается в вашу систему.

Чтобы скачать ранее загруженное правило сегментации, которое вы загрузили ранее, выполните следующие действия:

  1. На странице «Настройки Setup_gear.png» прокрутите вниз раздел «Настройки проекта» и нажмите «Сегментация».

    Открывается страница сегментации.

  2. Нажмите на значок Настроек справа и выберите Настроить столбцы: customize-segmentation-columns.png

  3. Включить столбец Имя файла

  4. Нажмите на имя файла, чтобы скачать предварительно сохраненное правило.

Редактировать сокращения в файле .XLSX

Для отдельных языков можно указать сокращения, после которых не следует создавать новые сегменты.

Чтобы редактировать сокращения, выполните следующие действия:

  1. Откройте скачанный файл .XLSX в редакторе.

  2. Изменить содержимое следующим форматированием:

    Файл XLSX должен содержать два столбца без заголовков.

    • Колонка 1: Аббревиатура будет указана

    • Колонка 2: Спецификация поведения в сегментации

      • ABBR_UPPER_NUM

        Новый сегмент не создается, если за сокращением следует каталог, а затем цифра, символ (математика, знаки валюты, дингбаты и т. д.) или слово с первой буквой в верхнем регистре.

      • ABBR_NUM

        Новый сегмент не будет создан, если за сокращением следует каталог, а затем цифра.

  3. Сохраните отредактированный файл .XLSX.

Редактировать стандартные выражения в файле .SRX

Редактирование файлов .SRX — сложный процесс, подходящий только пользователям, имеющим опыт использования регулярных выражений

Существует несколько правил, которые можно изменить в файле SRX:

  • Импортировать текст из файла XLSX без сегментации. Одна ячейка равна одному сегменту.

  • Импортируйте текст новой строкой с заказом разделить один сегмент на два.

  • Используйте двоеточие (или любой другой символ) в качестве разделителя сегментов.

  • Запретить использовать точку с запятой (или любой другой символ) в качестве разделителя сегментов.

  • Удаление сокращения из списка (текст будет сегментирован).

Эти правила основаны на символах. В качестве разделителя сегментов можно использовать только один символ. Группы символов (например: <p>) нельзя использовать в качестве разделителя сегментов.

Чтобы редактировать файл SRX, выполните следующие действия:

  1. Откройте файл в текстовом редакторе, например, Блокнот ++.

  2. редактировать, используя стандартные выражения, или полностью удалить внутреннюю сегментация.

    Например:

    BreakRules_Example.png
    • <rule break="no">

      Список правил, в которых сегмент не будет нарушен. Т. е. список сокращений

    • <rule> <berebreak>

      Регулярное выражение для символа перед разрывом (например, в конце предложения «. ? ! :»). Например, если вы не хотите, чтобы текст сегмента ставился через двоеточие, просто удалите : из каждого <rule><berebreak> кода.

    • <rule> <afterbreak>

      Регулярное выражение для символа после разрыва (например, в начале нового предложения; каталог и заглавная буква).

  3. Сохраните измененный файл SRX.

Загрузить новые правила сегментации

Чтобы загрузить измененные или новые правила сегментации, выполните следующие действия:

  1. На странице «Настройки Setup_gear.png» прокрутите вниз раздел «Настройки проекта» и нажмите «Сегментация».

    Открывается страница сегментации.

  2. Нажмите «Создать».

    Откроется страница Загрузить пользовательский файл сегментации в формате XLSX или SRX.

  3. Выберите язык в раскрывающемся списке.

  4. Укажите Имя правила.

  5. Нажмите «Выбрать файл».

    Открывается окно выбора файла.

  6. выбрать файл с измененными правилами для загрузить.

  7. Проверьте Основные, будут ли правила пользовательской сегментации основными правилами сегментации для выбранного языка.

  8. Нажмите «Создать».

    Открывается страница сегментации, в список добавлено правило.

Использовать правила пользовательской сегментации, чтобы Импортировать задания

Чтобы использовать пользовательские правила импортируемого задания, выполните следующие действия:

  1. На этапе 8 создания задания нажмите «Импортировать файлы» сегментации и длины сегмента.

    Открывается раскрывающееся окно параметров сегментации и длины сегмента.

  2. Выберите измененные правила в раскрывающемся списке правил сегментации оригинала.

  3. Нажмите «Создать».

    Задание создается и добавляется в список по указанным правилам сегментации.

Изменение примера сегментации (1 сегмент ячейки 1)

Удалить все правила внутренней сегментации из файла SRX, оставив только базовую сегментацию всего применяемого абзаца, элемента или ячейки. Это правило сегментации можно применить ко всем типам файлов (MS Word, XML, HTML, Excel и т. д.).

Например:

A

B

1

Питер! Подожди!

2

Привет.

3

Этот пример XLSX, импортированный с сегментацией по умолчанию, будет иметь 3 сегмента: Питер!, Стоп!, и Здравствуйте.

Если удалить всю внутреннюю сегментацию, оставив только базовую сегментацию на основе Ячейки, то сегментов останется всего два: Питер! Подожди! и Привет.

Отредактируйте файл SRX, чтобы удалить все правила сегментации по умолчанию, например, код между <!-- нарушить правила --> и </languagerule>.

Например:

1cell-1segment-srx.png

Каскад может привести к тому, что этот пример не будет работа. В таком случае откройте отредактированный файл SRX в Notepad++, найдите два атрибута элемента заголовка и измените оба на нет.

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.