Машинный перевод

Machine Translation (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Доступны интеграции со многими поставщиками машинного перевода. Машинный перевод можно использовать в Prase Language AI или настроить прямое соединение со сторонними системами машинного перевода (DeepL, Amazon Translate и Google Translate).

Варианты использования

Использовать исходный машинный перевод

В случаях, когда идеальный перевод не требуется, например, внутренняя коммуникация, можно использовать неотредактированный машинный перевод. В зависимости от качества памяти переводов даже неотредактированный машинный перевод может иметь определенное качество. Необработанный машинный перевод генерируется на этапе предварительного перевода.

Постредактирование машинного перевода (MTPE)

Более высокое качество перевода требует проверки и редактирования исходного машинного перевода профессиональными лингвистами. Рабочий процесс перевода должен включать машинный перевод, процессы редактирования и проверки, а также управление и уведомления клиентов. Решения постредактирования заносятся в базы памяти переводов и терминов для повторного использования.

Настройки системы машинного перевода

На странице систем машинного перевода отображается таблица используемых систем, можно настроить Phrase Language AI и добавить сторонние системы машинного перевода.

Чтобы получить доступ к настройкам систем машинного перевода, выполните следующие действия:

  1. Со страницы Setup_gear.png настроек прокрутите вниз раздел «Интеграции».

  2. Нажмите на «системы машинного перевода».

Использование символов

На странице «Системы машинного перевода» представлена диаграмма использования символов для всех систем машинного перевода (МТ), связанных с профилем.

Использование символов машинного перевода (МТ) рассчитывается на основе текста оригинала, включая пробелы, и при подтверждении сегментов, в которых нет alt-trans (на основе настроек).

Данные для конкретной системы можно просмотреть, сняв выделение с названий остальных систем внизу диаграммы. На диаграмме отображаются данные только за последние 30 дней.

По умолчанию менеджеры проектов могут видеть данные только по созданным проектам.

Настройка сторонних систем машинного перевода (МТ)

Если Phrase Language AI не используется, к сторонним системам машинного перевода можно получить доступ через интерфейс приложений API. Если в phrase используется сторонний машинный перевод (МТ), убедитесь, что вы ознакомились и разобрались с правилами и условиями данного поставщика машинного перевода (МТ). Некоторые системы машинного перевода (МТ) имеют конкретные ограничения.

Чтобы настроить новую систему машинного перевода, попросите пользователя-администратора выполнить следующие действия:

  1. Со страницы Setup_gear.png настроек прокрутите вниз раздел «Интеграции».

  2. Нажмите на «системы машинного перевода».

    Открывается страница систем машинного перевода.

  3. Нажмите «Создать»

    Откроется окно «Создание системы машинного перевода».

  4. Выберите тип системы машинного перевода (МТ) в раскрывающемся списке и нажмите «Создать».

    Открывается страница «Создать».

  5. Заполните обязательные поля в соответствии с типом системы машинного перевода (МТ).

  6. Выберете варианты (применимо не ко всем типам систем машинного перевода (МТ)

    • Добавить отметки (Ключ и значение)

    • Включить теги

    • Использовать по умолчанию

  7. Нажмите «Сохранить».

    Система добавлена в список систем машинного перевода.

Некоторые системы машинного перевода не используются в открытом доступе, а некоторые доступны только в конкретных версиях.

Очистка данных MT

Доступно для:

  • План Enterprise (Устаревшая версия)

Свяжитесь с отделом продаж по вопросам лицензирования.

Исходные данные можно фильтровать и извлекать из баз памяти переводов, чтобы использовать для обучения пользовательских систем машинного перевода через интерфейс приложений API.

Документация API

Процесс очистки данных:

  1. Исходные данные из указанных пар языковых стандартов загружаются из баз памяти переводов.

  2. Данные фильтруются.

    Сегменты, в которых оригинал совпадает с переводом, отбрасываются вместе с тегами, а данные дедублируются.

    Фильтрация упрощена для языков CJK.

  3. Удаляется 10% данных с наименьшим смысловым сходством оригинала и перевода.

    Соотношение сброшенных данных может быть определено с помощью коэффициента PreserveRatio.

  4. Данные конвертируются в TXT/TSV в соответствии с настройками выходного формата.

Критерии очистки:

  • Минимальная/максимальная длина

    Для каждого сегмента требуется не менее 5 символов и не менее 3 букв в любом алфавите/скрипте. Сегмент должен быть короче 1000 символов. Несоответствующие сегменты отбрасываются

  • Соотношение длины

    Зависит от языка

    Отношение длины сегмента оригинала к длине сегмента перевода (и наоборот) не может быть больше 2.

    Пример:

    Если сегмент оригинала содержит 30 символов, а перевод — 70 символов, то пара сегментов будет сброшена.

  • Оценка LASER

    Пары сегментов, прошедшие первичную проверку, получают оценку с использованием метрики LASER и сортируются в соответствии с оценкой; пары сегментов, получившие оценку более 90%, сохраняются. LASER автоматически определяет, похожи ли предложения на двух разных языках. Эта проверка ориентирована в основном на несогласованные/зашумленные записи в памяти переводов (TM).

Поддерживаемые сторонние системы машинного перевода

  • Alexa Translations A.I. (ранее Yappn)

  • Amazon Translate

  • Apertium

  • Closed NMT

  • CrossLang

  • DeepL Pro Advanced и DeepL Pro Ultimate (обратитесь в службу поддержки DeepL, чтоб получить ключ интерфейса приложений API v1 для Инструментов CAT)

  • Fair Trade Translation

  • Globalese

  • Globalese NMT (нейронный машинный перевод)

  • Google AutoML

    Примечание

    При добавлении Google AutoML в Prase Language AI требуется информация о названии платформы из-за поддержки и потенциального использования глоссариев машинного перевода (МТ).

  • Google Translate

    ВАЖНО:

    С 3 ноября 2020 года все новые проекты, созданные с использованием Google Translate в качестве выбранной системы, будут автоматически использовать систему нейронного машинного перевода (NMT) Google по умолчанию вместо системы статистического машинного перевода (SMT) Google.

  • Human Science

  • KantanMT

  • Kodensha MT

  • Language Weaver (ранее SDL BeGlobal)

  • Microsoft Custom Translator (в Microsoft Azure задайте местоположение «глобальный»)

  • Microsoft Translator / Microsoft Translator Hub

  • Mirai Translator

  • MoraviaMT

  • NICT

  • NpatMT

  • Omniscien Technologies

  • PangeaMT

  • PROMT

  • Rozetta T-3MT

  • Rozetta T-4OO

  • SDL Language Cloud

  • Skrivanek

  • Sunda MT

  • Systran

  • Systran PNMT

  • T-tact AN-ZIN

  • Tauyou

  • Tauyou Real-time

  • Tencent TranSmart

    ВАЖНО:

    Доступно только через Phrase Language AI. Поддержка переводов zh -> en и en-> zh (только упрощенный китайский).

  • Tilde MT

  • Toshiba

  • Ubiqus NMT

  • Yandex

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.