La segmentación es la división de textos fuente en partes más pequeñas. Esto mejora la recuperación de texto traducido previamente de una memoria de traducción. Los segmentos se presentan en el editor y pueden ser filtrados. Si un proyecto tiene pasos de flujo de trabajo, los cambios en los segmentos se presentan en el panel de cambios de traducción.
Las reglas de segmentación predeterminadas corresponden a las especificidades de cada idioma soportado y pueden ser personalizadas.
Los trabajos importados con mala segmentación, como archivos de documentos mal formateados o la aplicación de personalización de segmentación inapropiada, pueden afectar los valores de coincidencia de TM.
Ejemplo:
Buena segmentación:
-
Las memorias de traducción con idiomas de destino multilingües son soportadas y pueden ser utilizadas bidireccionalmente.
Valor de coincidencia del 100%.
Mala segmentación
-
Las memorias de traducción con idiomas de destino multilingües son soportadas.
Valor de coincidencia del 100%.
-
y pueden ser utilizadas bidireccionalmente.
Valor de coincidencia del 63%.
Las reglas de segmentación personalizadas pueden aplicarse a trabajos y plantillas de proyecto. Si un proyecto requiere una regla de segmentación personalizada, se necesitará crear una plantilla para ese proyecto. Cuando se establece como primaria, las reglas de segmentación personalizadas se aplican a todos los nuevos trabajos importados para ese idioma fuente.
Hay dos tipos de reglas de segmentación:
-
Abreviaciones al archivo .XLSX
-
Expresión regular de archivos .SRX
Para usar reglas personalizadas, descarga las reglas predeterminadas, modifícalas, carga el archivo modificado y luego aplícalas a trabajos específicos.
Precaución
Al agregar reglas de segmentación personalizadas para un idioma fuente CJK sin espacios (mientras que un idioma de destino usará espacios como delimitador de palabras), asegúrate de que se agreguen espacios al principio o al final de los segmentos de destino divididos por la regla personalizada; esto delimita palabras en la traducción. Mientras esto sucede automáticamente en segmentos formados por las reglas de segmentación predeterminadas, no se agregan espacios en segmentos divididos manualmente o aquellos formados por reglas de segmentación personalizadas adicionales.
Para descargar las reglas de segmentación predeterminadas, sigue estos pasos:
-
Desde la página de Configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Selecciona el idioma a personalizar y haz clic en Exportar XLSX/SRX.
Se abre la ventana
. -
Selecciona formato:
-
XLSX proporciona una lista de abreviaciones.
-
SRX proporciona reglas de expresión regular.
-
-
Selecciona un idioma de la lista desplegable.
-
Haz clic en Descargar.
El archivo se descarga en tu sistema.
Para descargar una regla de segmentación previamente cargada que subiste anteriormente, sigue estos pasos:
-
Desde la página de Configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Haz clic en el ícono de Configuración a la derecha y elige Personalizar columnas:
-
Habilitar la columna Nombre de archivo
-
Haga clic en un nombre de archivo para descargar una regla preguardada.
Las abreviaturas se pueden especificar para idiomas individuales después de lo cual no se deben crear nuevos segmentos.
Para editar abreviaturas, siga estos pasos:
-
Abra el archivo .XLSX descargado en un editor.
-
Cambie el contenido con el siguiente formato:
El archivo XLSX debe tener dos columnas sin encabezados.
-
Columna 1: Abreviatura a especificar
-
Columna 2: Especificación del comportamiento de segmentación
-
ABBR_UPPER_NUM
Un nuevo segmento no se creará si la abreviatura es seguida por un espacio en blanco y luego por un número, un símbolo (matemáticas, signos de moneda, dingbats, etc.) o una palabra con la primera letra en mayúscula.
-
ABBR_NUM
Un nuevo segmento no se creará si la abreviatura es seguida por un espacio en blanco y luego por un número.
-
-
-
Guarde el archivo .XLSX editado.
Editar archivos .SRX es un proceso complejo adecuado solo para usuarios experimentados en el uso de expresiones regulares
Hay varias reglas que se pueden cambiar en un archivo SRX:
-
Importar texto de un archivo XLSX sin segmentación; una celda es igual a un segmento.
-
Importar texto con una nueva línea para dividir un segmento en dos.
-
Usar dos puntos (o cualquier otro carácter) como separador de segmentos.
-
Prohibir el uso de un punto y coma (o cualquier otro carácter) como separador de segmentos.
-
Eliminar una abreviatura de la lista (el texto será segmentado).
Estas reglas son basadas en caracteres; solo se puede usar un solo carácter como separador de segmentos. Grupos de caracteres (por ejemplo: <p>) no pueden ser usados como separador de segmentos.
Para editar un archivo SRX, sigue estos pasos:
-
Abre el archivo en un editor de texto como Notepad ++.
-
Edita usando expresiones regulares o elimina la segmentación interna completamente.
Ejemplo:
-
<rule break="no">
La lista de reglas, donde el segmento no será roto. Es decir, una lista de abreviaturas
-
<rule> <beforebreak>
Una expresión regular para un carácter antes de un quiebre (por ejemplo, al final de una oración ". ? ! :"). Si, por ejemplo, no quieres segmentar texto después de un dos puntos, simplemente elimina
:
de cada<rule><beforebreak>
código. -
<rule> <afterbreak>
Una expresión regular para un carácter después de un quiebre (por ejemplo, al inicio de una nueva oración; un espacio y letra mayúscula).
-
-
Guarda el archivo SRX modificado.
Para cargar reglas de segmentación modificadas o nuevas, sigue estos pasos:
-
Desde la página de configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Haz clic en Nuevo.
Se abre la página
. -
Selecciona un
de la lista desplegable. -
Proporciona un
para la regla. -
Haz clic en Elegir archivo.
Se abre una ventana de selección de archivos.
-
Selecciona el archivo de reglas modificadas para cargar.
-
Marca
si las reglas de segmentación personalizadas serán las reglas de segmentación primarias para el idioma seleccionado. -
Haz clic en Crear.
Se abre la página
y la regla se ha añadido a la lista.
Para usar reglas personalizadas en una importación de trabajos o configurar la longitud del segmento objetivo, sigue estos pasos:
-
En el paso 8 de creación de un trabajo, haz clic en Segmentación y longitud del segmento en la .
Se abre la lista desplegable de opciones
. -
Selecciona las reglas modificadas de la lista desplegable
. -
Opcionalmente, configura un límite para la longitud del segmento objetivo según los requisitos del proyecto (por ejemplo, traducción de subtítulos):
-
Selecciona
e ingresa el porcentaje preferido para limitar la longitud del segmento según el segmento de origen. -
Selecciona
e ingresa el conteo de caracteres para limitar la longitud del segmento por número de caracteres.
-
-
Haz clic en Crear.
El trabajo se crea y se añade a la lista utilizando las reglas de segmentación especificadas.
Elimina todas las reglas de segmentación inner de un archivo SRX dejando solo la segmentación básica del párrafo, elemento o celda completa que se está aplicando. Esta regla de segmentación se puede aplicar a todos los tipos de archivos (MS Word, XML, HTML, Excel, etc.).
Ejemplo:
Este ejemplo de XLSX importado con segmentación predeterminada tendrá 3 segmentos: Peter!, ¡Espera!, y Hola.
Si se elimina toda la segmentación interna dejando solo la segmentación básica basada en la celda, entonces solo hay dos segmentos: ¡Peter! ¡Espera! y Hola.
Edita el archivo SRX para eliminar todas las reglas de segmentación predeterminadas, es decir, el código entre <!-- break rules -->
y </languagerule>
.
Ejemplo:
El encadenamiento puede hacer que este ejemplo no funcione. En tal caso, abre el archivo SRX editado en Notepad++, encuentra los dos atributos del elemento header
y cambia ambos a no
.