La segmentación es el proceso de dividir textos fuente en partes más pequeñas. Esto mejora la recuperación de texto previamente traducido de una memoria de traducción. Los segmentos se presentan en el editor y se pueden filtrar. Si un proyecto tiene pasos del flujo de trabajo, los cambios en los segmentos se presentan en el panel de cambios de traducción.
Las reglas de segmentación predeterminadas corresponden a las características de cada idioma compatible y pueden ser personalizadas.
Los trabajos importados con una segmentación deficiente, como archivos de documento mal formateados o la aplicación de una personalización de segmentación inapropiada, pueden afectar los valores de concordancia de la TM. Se recomienda dedicar algo de tiempo a revisar y preparar el archivo fuente antes de importarlo; un problema común es el uso incorrecto de saltos de línea frente a saltos de párrafo.
Ejemplo:
Buena segmentación:
-
Las memorias de traducción con idiomas meta multilingües son compatibles y pueden usarse bidireccionalmente.
Valor de concordancia del 100%.
Mala segmentación
-
Las memorias de traducción con idiomas meta multilingües son compatibles.
Valor de concordancia del 100%.
-
y se pueden usar bidireccionalmente.
Valor de concordancia del 63%.
Las reglas de segmentación personalizadas se pueden aplicar a trabajos y plantillas de proyecto. Si un proyecto requiere una regla de segmentación personalizada, se necesitará crear una plantilla para ese proyecto. Cuando se establece como principal, se aplican reglas de segmentación personalizadas a todos los nuevos trabajos importados para ese idioma de origen.
Hay dos tipos de reglas de segmentación:
-
Abreviaciones al archivo .XLSX
-
Expresión regular de archivos .SRX
Para usar reglas personalizadas, descarga las reglas predeterminadas, modifícalas, carga el archivo modificado y luego aplícalas a los trabajos especificados.
Precaución
Al agregar reglas de segmentación personalizadas para un idioma de origen CJK sin espacios (mientras que un idioma de destino utilizará espacios como delimitador de palabras), asegúrate de que se agreguen espacios al principio o al final de los segmentos de destino divididos por la regla personalizada; esto delimita las palabras en la traducción. Mientras esto sucede automáticamente en los segmentos formados por las reglas de segmentación predeterminadas, no se agregan espacios en segmentos divididos manualmente o en aquellos formados por reglas de segmentación personalizadas adicionales.
Para descargar las reglas de segmentación predeterminadas, sigue estos pasos:
-
Desde la página de configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página .
-
Selecciona el idioma a personalizar y haz clic en Exportar XLSX/SRX.
Se abre la ventana .
-
Selecciona formato:
-
XLSX proporciona una lista de abreviaciones.
-
SRX proporciona reglas de expresión regular.
-
-
Selecciona un idioma de la lista desplegable.
-
Haz clic en Descargar.
El archivo se descarga en tu sistema.
Para descargar una regla de segmentación previamente cargada que subiste anteriormente, sigue estos pasos:
-
Desde la página de configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página .
-
Haz clic en el ícono de Configuración a la derecha y elige Personalizar columnas:
-
Habilita la columna Nombre de archivo
-
Haz clic en un nombre de archivo para descargar una regla preguardada.
Las abreviaturas pueden especificarse para idiomas individuales después de las cuales no se deben crear nuevos segmentos.
Para editar abreviaturas, sigue estos pasos:
-
Abre el archivo .XLSX descargado en un editor.
-
Cambia el contenido con el siguiente formato:
El archivo XLSX debe tener dos columnas sin encabezados.
-
Columna 1: Abreviatura a especificar
-
Columna 2: Especificación del comportamiento de segmentación
-
ABBR_UPPER_NUM
No se creará un nuevo segmento si la abreviatura es seguida por un espacio en blanco y luego por un número, un símbolo (signos matemáticos, de moneda, dingbats, etc.) o una palabra con la primera letra en mayúscula.
-
ABBR_NUM
No se creará un nuevo segmento si la abreviatura es seguida por un espacio en blanco y luego por un número.
-
-
-
Guarda el archivo .XLSX editado.
Editar archivos .SRX es un proceso complejo adecuado solo para usuarios con experiencia en el uso de expresiones regulares
Hay varias reglas que se pueden cambiar en un archivo SRX:
-
Importar texto de un archivo XLSX sin segmentación; una celda es igual a un segmento.
-
Importar texto con un salto de línea para dividir un segmento en dos.
-
Usar dos puntos (o cualquier otro carácter) como separador de segmentos.
-
Prohibir el uso de un punto y coma (o cualquier otro carácter) como separador de segmentos.
-
Eliminar una abreviatura de la lista (el texto será segmentado).
Estas reglas son basadas en caracteres; solo se puede usar un único carácter como separador de segmentos. Grupos de caracteres (por ejemplo: <p>) no pueden ser usados como separador de segmentos.
Para editar un archivo SRX, sigue estos pasos:
-
Abre el archivo en un editor de texto como Notepad ++.
-
Edita usando expresiones regulares o elimina la segmentación interna completamente.
Ejemplo:
-
<rule break="no">La lista de reglas, donde el segmento no será roto. Es decir, una lista de abreviaturas
-
<rule> <beforebreak>Una expresión regular para un carácter antes de un quiebre (por ejemplo, al final de una oración ". ? ! :"). Si, por ejemplo, no deseas que el texto del segmento aparezca después de un dos puntos, simplemente elimina
:de cada<rule><beforebreak>código. -
<rule> <afterbreak>Una expresión regular para un carácter después de un quiebre (por ejemplo, al inicio de una nueva oración; un espacio y una letra mayúscula).
-
-
Guardar el archivo SRX modificado.
Para cargar reglas de segmentación modificadas o nuevas, sigue estos pasos:
-
Desde la página de configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página .
-
Haz clic en Nueva.
Se abre la página .
-
Selecciona un de la lista desplegable.
-
Proporciona un para la regla.
-
Haz clic en Elegir archivo.
Se abre una ventana de selección de archivos.
-
Selecciona el archivo de reglas modificadas para cargar.
-
Marca si las reglas de segmentación personalizadas serán las reglas de segmentación primarias para el idioma seleccionado.
-
Haz clic en Crear.
Se abre la página y la regla se ha añadido a la lista.
Para usar reglas personalizadas en una importación de trabajo o configurar la longitud del segmento objetivo, sigue estos pasos:
-
En el paso 8 de crear un trabajo, haz clic en Segmentación y longitud del segmento desde la .
Se abre la lista desplegable de opciones .
-
Selecciona las reglas modificadas de la lista desplegable .
-
Opcionalmente, configura un límite para la longitud del segmento objetivo según los requisitos del proyecto (por ejemplo, traducción de subtítulos):
-
Selecciona e ingresa el porcentaje preferido para limitar la longitud del segmento según el segmento de origen.
-
Selecciona e ingresa el conteo de caracteres para limitar la longitud del segmento por número de caracteres.
-
-
Haz clic en Crear.
El trabajo se crea y se agrega a la lista utilizando las reglas de segmentación especificadas.
Elimina todas las reglas de segmentación internas de un archivo SRX dejando solo la segmentación básica del párrafo, elemento o celda completa que se aplica. Esta regla de segmentación se puede aplicar a todos los tipos de archivos (MS Word, XML, HTML, Excel, etc.).
Ejemplo:
Este ejemplo de XLSX importado con segmentación predeterminada tendrá 3 segmentos: ¡Peter!, ¡Espera!, y Hola.
Si se elimina toda la segmentación interna dejando solo la segmentación básica basada en la Celda, entonces solo hay dos segmentos: ¡Peter! ¡Espera! y Hola.
Edita el archivo SRX para eliminar todas las reglas de segmentación predeterminadas, es decir, el código entre <!-- reglas de ruptura --> y </languagerule>.
Ejemplo:
La cascada puede hacer que este ejemplo no funcione. En tal caso, abre el archivo SRX editado en Notepad++, encuentra los dos atributos del elemento encabezado y cambia ambos a no.