Машинный перевод

Машинный перевод (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Доступны интеграции со многими поставщиками машинного перевода. Машинный перевод можно использовать с Language AI или путем настройки прямых соединений с , такими как DeepL, Amazon Translate и Google Translate.

Важно

Microsoft Translator с обратной связью и управление машинным переводом через Memsource устарели.

Варианты использования

Необработанный машинный перевод

В случаях, когда идеальный перевод не требуется, например, в процессе внутренней коммуникации, можно использовать неотредактированный машинный перевод. В зависимости от качества памяти переводов даже неотредактированный машинный перевод может иметь определенное качество. При предварительном переводе генерируется необработанный машинный перевод.

Постредактирование машинного перевода (MTPE)

Высокое качество перевода требует проверки и редактирования неотредактированного машинного перевода профессиональными лингвистами. Рабочий процесс перевода должен включать машинный перевод, процессы редактирования и проверки, а также уведомления руководства и клиентов. Решения о переводе после редактирования вносятся в базы памяти переводов и терминологические базы для повторного использования.

Настройки системы машинного перевода

На странице систем машинного перевода представлена таблица использования систем машинного перевода, можно настроить Phrase Language AI и добавить сторонние системы машинного перевода.

Чтобы получить доступ к настройкам систем машинного перевода, выполните следующие действия.

  1. Со страницы Настройки Setup_gear.png прокрутите вниз раздел Интеграции.

  2. Нажмите на системы машинного перевода.

Употребление символов

На странице Систем машинного перевода представлена диаграмма использования символов для всех систем машинного перевода, связанных с профилем.

Использование символов машинного перевода рассчитывается на основе исходного текста, включая пробелы, и при подтверждении сегментов, в которых нет alt-trans (на основе настроек).

Данные для определенной системы можно просмотреть, отменив выбор названий других систем внизу диаграммы. На графике отображаются данные только за последние 30 дней.

По умолчанию менеджеры проектов могут видеть данные только по созданным проектам.

Phrase Language AI

Надстройка Phrase Language AI включает неограниченный объем машинного перевода для постредактирования рабочих процессов.

Настройка сторонних систем машинного перевода

Если Phrase Language AI не используется, сторонние системы машинного перевода могут быть доступны через API. При использовании стороннего машинного перевода в Phrase убедитесь, что условия данного поставщика машинного перевода были прочитаны и понятны. Некоторые системы машинного перевода имеют ограничения.

Чтобы настроить новую систему машинного перевода, попросите пользователя-администратора выполнить следующие действия:

  1. Со страницы Настройки Setup_gear.png прокрутите вниз раздел Интеграции.

  2. Нажмите на системы машинного перевода.

    Откроется страница систем машинного перевода.

  3. Нажмите на Создать

    Откроется окно Создать систему машинного перевода.

  4. Выберите тип системы машинного перевода в раскрывающемся списке и нажмите Создать.

    Открывается страница Создать.

  5. Заполните обязательные поля в соответствии с типом системы машинного перевода.

  6. Выбрать варианты (не для всех типов систем машинного перевода)

    • Добавить отметки (ключ и значение)

    • Включить теги

    • Сделать по умолчанию

    • Оценка качества машинного перевода

  7. Нажмите Сохранить.

    Система добавлена в список систем машинного перевода.

Некоторые системы машинного перевода не предназначены для общего пользования, а некоторые доступны только в определенных версиях.

Очистка данных MT

Доступно для

  • План для предприятий (устаревший режим)

Свяжитесь с отделом продаж для вопросов лицензирования.

Исходные данные можно фильтровать и извлекать из памяти переводов для использования в обучении пользовательских систем машинного перевода с помощью API.

API-документация

Процесс очистки данных:

  1. Исходные данные из указанных пар языковых стандартов загружаются из памяти переводов.

  2. Данные фильтруются.

    Сегменты с одним и тем же исходным текстом и переводом отбрасываются вместе с тегами, а данные дедублируются.

    Фильтрация более спокойна для языков CJK.

  3. Удаляется 10% данных с наименьшим семантическим сходством источника и перевода.

    Соотношение сброшенных данных может определяться с помощью коэффициента сохранения.

  4. Данные конвертируются в TXT/TSV в соответствии с настройками выходного формата.

Критерии очистки:

  • Минимальная/максимальная длина

    Для каждого сегмента требуется не менее 5 символов и не менее 3 букв в любом алфавите/скрипте. Сегмент должен быть короче 1000 символов. Несоответствующие сегменты отбрасываются

  • Соотношение длины

    Специфика языка.

    Отношение длины исходного сегмента к длине целевого (и наоборот) не может быть больше 2.

    Пример:

    Если в исходном сегменте 30 символов, а в целевом сегменте 70 символов, пара сегментов будет сброшена.

  • LASER score

    Пары сегментов, прошедшие первичную проверку, получают оценку с использованием LASER- метрики и сортируются в соответствии с оценкой; пары сегментов, получившие оценку более 90%, сохраняются. LASER автоматически определяет, похожи ли предложения на двух разных языках. Эта проверка ориентирована в основном на несоответствующие/шумные записи ТМ.

Поддерживаемые сторонние системы машинного перевода

  • Alexa Translations A.I. (ранее Yappn)

  • Amazon Translate

  • Аперций

  • Закрытый NMT

  • CrossLang

  • DeepL Pro Advanced и DeepL Pro Ultimate (обратитесь в службу поддержки DeepL по поводу ключа API v1 для CAT-инструментов)

  • Добросовестный торговый перевод

  • Globalese

  • Globalese NMT (нейронный машинный перевод)

  • Google AutoML

    Примечание

    При добавлении Google AutoML в Language AI необходима информация о названии контейнера из-за поддержки и потенциального использования глоссариев MT.

  • Переводчик Google

    Важно

    С 3 ноября 2020 года все новые проекты, созданные с Google Translate в качестве выбранной системы, будут автоматически использовать систему нейронного машинного перевода (NMT) Google по умолчанию вместо системы статистического машинного перевода (SMT) Google.

  • Human Science

  • KantanMT

  • Kodensha MT

  • Language Weaver (ранее SDL BeGlobal)

  • Пользовательский переводчик Microsoft (в Microsoft Azure задайте местоположение «глобальный»)

  • Microsoft Translator / Microsoft Translator Hub

  • Переводчик Mirai

  • MoraviaMT

  • NICT

  • NpatMT

  • Omniscien Technologies

  • PangeaMT

  • PROMT

  • Rozetta T-3MT

  • Rozetta T-4OO

  • SDL Language Cloud

  • Skrivanek

  • Sunda MT

  • Systran

  • Systran PNMT

  • T-tact AN-ZIN

  • Tauyou

  • Tauyou в режиме реального времени

  • Tencent TranSmart

    Важно

    Доступно только через Phrase Language AI. Поддержка переводов zh -> en и en-> zh (только упрощенный китайский).

  • Tilde MT

  • Toshiba

  • Ubiqus NMT

  • Яндекс

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.