La traducción automática (MT) es un proceso automatizado donde segmentos de texto son traducidos por un motor de MT seleccionado. MT se aplica típicamente al comienzo de un flujo de trabajo de localización para pretraducir contenido que no está emparejado con la memoria de traducción (TM). Esto reduce el esfuerzo manual en flujos de trabajo de localización a gran escala.
En Phrase TMS, están disponibles integraciones con muchos proveedores de MT. Es posible usar traducción automática con Phrase Language AI o estableciendo conexiones directas con motores de MT externos como DeepL, Amazon Translate y Google Translate. Para casos de uso específicos de dominio, es posible entrenar y desplegar modelos de MT personalizados utilizando TMs internas y terminología a través de Phrase Custom AI.
La calidad de salida de MT puede ser evaluada automáticamente utilizando el Quality Performance Score (QPS), que proporciona una puntuación de confianza para cada segmento.
Para usuarios que no necesitan acceso completo a TMS, Phrase Portal proporciona una interfaz segura para enviar contenido para traducción con MT habilitado.
Traducción automática en bruto
En los casos en los que no se requiere una traducción perfecta, como para comunicación interna, se puede utilizar una traducción automática en bruto, sin revisar. Según la calidad de la memoria de traducción, hasta una traducción automática sin revisar puede ofrecer cierta calidad. Se genera una traducción automática sin revisar en la pretraducción.
Posedición de traducción automática (MTPE)
Una traducción de mayor calidad requiere la revisión y edición de traducción automática en bruto por lingüistas profesionales. Un flujo de trabajo de traducción debe incluir la traducción automática, los procesos de edición y revisión y las notificaciones de gestión y a los clientes. Las decisiones que tomes al poseditar traducciones se recopilan en memorias de traducción y glosarios para su reutilización.
En la página de
se muestra el cuadro . Ahí se puede configurar Phrase Language AI y añadir motores de traducción automática externos.Para acceder a las configuraciones de los motores de traducción automática, sigue estos pasos:
La página
presenta un gráfico de uso de caracteres para todos los motores de MT asociados a un perfil.El uso de caracteres de MT se calcula sobre el texto fuente incluyendo espacios y al confirmar segmentos que no tienen «alt-trans» (según configuración).
Los datos de un motor específico se pueden ver al desmarcar los nombres del resto de motores en la parte inferior del gráfico. El gráfico solo muestra datos de los últimos 30 días.
De forma predeterminada, los project managers solo pueden ver los datos relacionados con los proyectos que han creado.
Si no se está utilizando Phrase Language AI, se puede acceder a motores de traducción automática externos a través de una API. Si utilizas MT externa en Phrase, asegúrate de que has leído y entendido los términos y condiciones del proveedor de MT en cuestión. Algunos motores de MT tienen restricciones específicas.
Para configurar un nuevo motor de traducción automática, pide al administrador que siga estos pasos:
-
En la página Configuración
, baja hasta la sección .
-
Haz clic en Motores de traducción automática.
Se abrirá la página
. -
Haz clic en Crear.
Verás la ventana
. -
Selecciona tipo de motor de MT en la lista desplegable y haz clic en Crear.
Se abrirá la página
. -
Rellena los campos obligatorios según el tipo de motor de MT.
-
Selecciona una de las opciones (no es válido para todos los tipos de motor MT).
-
Agregar etiquetas (clave y valor)
-
Incluir etiquetas
-
Dejar como predeterminado
-
-
Haz clic en Guardar.
El motor se ha añadido a la lista de motores de traducción automática.
Algunos motores de traducción automática no son para uso público y otros solo son accesibles en ediciones específicas.
-
Plan Enterprise (anterior)
Ponte en contacto con el equipo de ventas para preguntar por nuestros planes.
Los datos sin procesar se pueden filtrar y extraer de las memorias de traducción para usar en el entrenamiento de motores de traducción automática personalizado a través de una API.
Documentación API
Proceso de limpieza de datos:
-
Se descargan de las memorias de traducción los datos sin procesar de los pares de idiomas que selecciones.
-
Se filtran los datos.
Se descartan los segmentos con la misma fuente y meta junto con tags y se eliminan los datos duplicados.
El filtrado es menos estricto para los idiomas CJK.
-
Se elimina el 10 % de los datos con menor similitud semántica entre la fuente y la meta.
La relación de datos descartados se puede definir utilizando
preserveRatio
. -
Los datos se convierten a TXT/TSV en función de la configuración de
outputFormat
.
Criterios de limpieza:
-
Longitud mínima/máxima
Cada segmento requiere al menos 5 caracteres y al menos 3 letras en cualquier alfabeto o código. El segmento debe tener menos de 1000 caracteres. Se descartan los segmentos que no cumplan esto.
-
Relación de longitud
Según el idioma.
La relación entre la longitud segmento fuente y del segmento meta (y viceversa) no puede ser superior a 2.
Ejemplo:
Si el segmento fuente tiene 30 caracteres y el meta tiene 70 caracteres, se descartarán ambos segmentos.
-
Puntuación LASER
Los pares de segmentos que superan las comprobaciones iniciales se puntúan utilizando la métrica LASER y se clasifican según la puntuación. Los pares de segmentos que puntúan más del 90 % se mantienen. LASER detecta automáticamente si las frases en dos idiomas diferentes son similares. Esta revisión está dirigida principalmente a entradas de TM desalineadas o con ruido.
-
Alexa Translations A.I. (antes Yappn)
-
Amazon Translate
-
Apertium
-
Baidu
-
Closed NMT
-
CrossLang
-
DeepL Free, DeepL Pro Advanced y DeepL Pro Ultimate (contactar al soporte de DeepL para una clave de API v1 para herramientas CAT)
-
Fair Trade Translation
-
Globalese
-
Globalese NMT (traducción automática neuronal)
-
Google AutoML
Nota
Al agregar Google AutoML a Phrase Language AI, se requiere información sobre el nombre del cubo o bucket debido a la compatibilidad y el posible uso de glosarios de MT.
-
Google Translate
Importante
A partir del 3 de noviembre de 2020, todos los proyectos nuevos creados con Google Translate como motor seleccionado usarán automáticamente el motor de traducción automática neuronal (NMT) de Google por defecto en lugar del motor de traducción automática estadística (SMT) de Google.
-
Human Science
-
KantanMT
-
Kodensha MT
-
Language Weaver (antes SDL BeGlobal)
-
Microsoft Custom Translator (en Microsoft Azure, cambiar ubicación a «global»)
-
Microsoft Translator / Microsoft Translator Hub
-
Mirai Translator
-
MoraviaMT
-
NICT
-
NpatMT
-
Omniscien Technologies
-
PangeaMT
-
PROMT
-
Rozetta T-3MT
-
Rozetta T-4OO
-
SDL Language Cloud
-
Skrivanek
-
Sunda MT
-
Systran
-
Systran PNMT
-
T-tact AN-ZIN
-
Tauyou
-
Tauyou Real-time
-
Tencent TranSmart
Importante
Solo disponible a través Phrase Language AI. Soporta zh -> en y en-> zh traducciones (simplificado chino solamente).
-
Tilde MT
-
Toshiba
-
Ubiqus NMT
-
Yandex