Доступны интеграции со многими поставщиками машинного перевода. Машинный перевод можно использовать в Prase Language AI или настроить прямое соединение со сторонними системами машинного перевода (DeepL, Amazon Translate и Google Translate).
Использовать исходный машинный перевод
В случаях, когда идеальный перевод не требуется, например, внутренняя коммуникация, можно использовать неотредактированный машинный перевод. В зависимости от качества памяти переводов даже неотредактированный машинный перевод может иметь определенное качество. Необработанный машинный перевод генерируется на этапе предварительного перевода.
Постредактирование машинного перевода (MTPE)
Более высокое качество перевода требует проверки и редактирования исходного машинного перевода профессиональными лингвистами. Рабочий процесс перевода должен включать машинный перевод, процессы редактирования и проверки, а также управление и уведомления клиентов. Решения постредактирования заносятся в базы памяти переводов и терминов для повторного использования.
На странице
отображается таблица , можно настроить Phrase Language AI и добавить сторонние системы машинного перевода.Чтобы получить доступ к настройкам систем машинного перевода, выполните следующие действия:
На странице
представлена диаграмма использования символов для всех систем машинного перевода (МТ), связанных с профилем.Использование символов машинного перевода (МТ) рассчитывается на основе текста оригинала, включая пробелы, и при подтверждении сегментов, в которых нет alt-trans (на основе настроек).
Данные для конкретной системы можно просмотреть, сняв выделение с названий остальных систем внизу диаграммы. На диаграмме отображаются данные только за последние 30 дней.
По умолчанию менеджеры проектов могут видеть данные только по созданным проектам.
Если Phrase Language AI не используется, к сторонним системам машинного перевода можно получить доступ через интерфейс приложений API. Если в phrase используется сторонний машинный перевод (МТ), убедитесь, что вы ознакомились и разобрались с правилами и условиями данного поставщика машинного перевода (МТ). Некоторые системы машинного перевода (МТ) имеют конкретные ограничения.
Чтобы настроить новую систему машинного перевода, попросите пользователя-администратора выполнить следующие действия:
-
Со страницы настроек прокрутите вниз раздел «
. -
Нажмите на «системы машинного перевода».
Открывается страница
. -
Нажмите «Создать».
Откроется окно
. -
Выберите тип системы машинного перевода (МТ) в раскрывающемся списке и нажмите «Создать».
Открывается страница
. -
Заполните обязательные поля в соответствии с типом системы машинного перевода (МТ).
-
Выберете варианты (применимо не ко всем типам систем машинного перевода (МТ)
-
Добавить отметки (Ключ и значение)
-
Включить теги
-
Использовать по умолчанию
-
-
Нажмите «Сохранить».
Система добавлена в список систем машинного перевода.
Некоторые системы машинного перевода не используются в открытом доступе, а некоторые доступны только в конкретных версиях.
-
План Enterprise (Устаревшая версия)
Свяжитесь с отделом продаж по вопросам лицензирования.
Исходные данные можно фильтровать и извлекать из баз памяти переводов, чтобы использовать для обучения пользовательских систем машинного перевода через интерфейс приложений API.
Документация API
Процесс очистки данных:
-
Исходные данные из указанных пар языковых стандартов загружаются из баз памяти переводов.
-
Данные фильтруются.
Сегменты, в которых оригинал совпадает с переводом, отбрасываются вместе с тегами, а данные дедублируются.
Фильтрация упрощена для языков CJK.
-
Удаляется 10% данных с наименьшим смысловым сходством оригинала и перевода.
Соотношение сброшенных данных может быть определено с помощью
коэффициента PreserveRatio
. -
Данные конвертируются в TXT/TSV в соответствии с настройками
выходного формата
.
Критерии очистки:
-
Минимальная/максимальная длина
Для каждого сегмента требуется не менее 5 символов и не менее 3 букв в любом алфавите/скрипте. Сегмент должен быть короче 1000 символов. Несоответствующие сегменты отбрасываются
-
Соотношение длины
Зависит от языка
Отношение длины сегмента оригинала к длине сегмента перевода (и наоборот) не может быть больше 2.
Пример:
Если сегмент оригинала содержит 30 символов, а перевод — 70 символов, то пара сегментов будет сброшена.
-
Оценка LASER
Пары сегментов, прошедшие первичную проверку, получают оценку с использованием метрики LASER и сортируются в соответствии с оценкой; пары сегментов, получившие оценку более 90%, сохраняются. LASER автоматически определяет, похожи ли предложения на двух разных языках. Эта проверка ориентирована в основном на несогласованные/зашумленные записи в памяти переводов (TM).
-
Alexa Translations A.I. (ранее Yappn)
-
Amazon Translate
-
Apertium
-
Closed NMT
-
CrossLang
-
DeepL Pro Advanced и DeepL Pro Ultimate (обратитесь в службу поддержки DeepL, чтоб получить ключ интерфейса приложений API v1 для Инструментов CAT)
-
Fair Trade Translation
-
Globalese
-
Globalese NMT (нейронный машинный перевод)
-
Google AutoML
Примечание
При добавлении Google AutoML в Prase Language AI требуется информация о названии платформы из-за поддержки и потенциального использования глоссариев машинного перевода (МТ).
-
Google Translate
ВАЖНО:
С 3 ноября 2020 года все новые проекты, созданные с использованием Google Translate в качестве выбранной системы, будут автоматически использовать систему нейронного машинного перевода (NMT) Google по умолчанию вместо системы статистического машинного перевода (SMT) Google.
-
Human Science
-
KantanMT
-
Kodensha MT
-
Language Weaver (ранее SDL BeGlobal)
-
Microsoft Custom Translator (в Microsoft Azure задайте местоположение «глобальный»)
-
Microsoft Translator / Microsoft Translator Hub
-
Mirai Translator
-
MoraviaMT
-
NICT
-
NpatMT
-
Omniscien Technologies
-
PangeaMT
-
PROMT
-
Rozetta T-3MT
-
Rozetta T-4OO
-
SDL Language Cloud
-
Skrivanek
-
Sunda MT
-
Systran
-
Systran PNMT
-
T-tact AN-ZIN
-
Tauyou
-
Tauyou Real-time
-
Tencent TranSmart
ВАЖНО:
Доступно только через Phrase Language AI. Поддержка переводов zh -> en и en-> zh (только упрощенный китайский).
-
Tilde MT
-
Toshiba
-
Ubiqus NMT
-
Yandex