La segmentación es la división de textos fuente en partes más pequeñas. Esto mejora la recuperación de texto traducido previamente de una memoria de traducción. Los segmentos se presentan en el editor y pueden ser filtrados. Si un proyecto tiene pasos de flujo de trabajo, los cambios en los segmentos se presentan en el panel de cambios de traducción.
Las reglas de segmentación predeterminadas corresponden a las especificidades de cada idioma soportado y pueden ser personalizadas.
Los trabajos importados con mala segmentación, como archivos de documentos mal formateados o la aplicación de personalización de segmentación inapropiada, pueden afectar los valores de concordancia de TM. Se recomienda dedicar algo de tiempo a revisar y preparar el archivo fuente antes de la importación; un problema común es el uso incorrecto de saltos de línea frente a saltos de párrafo.
Ejemplo:
Buena segmentación:
-
Las memorias de traducción con idiomas de destino multilingües son soportadas y pueden ser utilizadas bidireccionalmente.
Valor de concordancia del 100%.
Mala segmentación
-
Las memorias de traducción con idiomas de destino multilingües son soportadas.
Valor de concordancia del 100%.
-
y pueden ser utilizadas bidireccionalmente.
Valor de concordancia del 63%.
Las reglas de segmentación personalizadas pueden aplicarse a trabajos y plantillas de proyecto. Si un proyecto requiere una regla de segmentación personalizada, se necesitará crear una plantilla para ese proyecto. Cuando se establece como primaria, las reglas de segmentación personalizadas se aplican a todos los nuevos trabajos importados para ese idioma fuente.
Hay dos tipos de reglas de segmentación:
-
Abreviaciones al archivo .XLSX
-
Expresión regular de archivos .SRX
Para usar reglas personalizadas, descarga las reglas predeterminadas, modifícalas, carga el archivo modificado y luego aplícalas a trabajos específicos.
Precaución
Al agregar reglas de segmentación personalizadas para un idioma fuente CJK sin espacios (mientras que un idioma de destino usará espacios como delimitador de palabras), asegúrate de que se agreguen espacios al principio o al final de los segmentos de destino divididos por la regla personalizada; esto delimita las palabras en la traducción. Mientras esto sucede automáticamente en segmentos formados por las reglas de segmentación predeterminadas, no se agregan espacios en segmentos divididos manualmente o aquellos formados por reglas de segmentación personalizadas adicionales.
Para descargar las reglas de segmentación predeterminadas, sigue estos pasos:
-
Desde la página de Configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Selecciona el idioma a personalizar y haz clic en Exportar XLSX/SRX.
Se abre la ventana
. -
Selecciona formato:
-
XLSX proporciona una lista de abreviaciones.
-
SRX proporciona reglas de expresión regular.
-
-
Selecciona un idioma de la lista desplegable.
-
Haz clic en Descargar.
El archivo se descarga en tu sistema.
Para descargar una regla de segmentación previamente cargada que subiste anteriormente, sigue estos pasos:
-
Desde la página de Configuración
, desplázate hacia abajo hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Haga clic en el icono de configuración a la derecha y elija Personalizar columnas:
-
Habilitar la columna de Nombre de archivo
-
Haga clic en un nombre de archivo para descargar una regla preguardada.
Las abreviaturas se pueden especificar para idiomas individuales después de los cuales no se deben crear nuevos segmentos.
Para editar abreviaturas, siga estos pasos:
-
Abra el archivo .XLSX descargado en un editor.
-
Cambie el contenido con el siguiente formato:
El archivo XLSX debe tener dos columnas sin encabezados.
-
Columna 1: Abreviatura a especificar
-
Columna 2: Especificación del comportamiento de segmentación
-
ABBR_UPPER_NUM
Un nuevo segmento no se creará si la abreviatura es seguida por un espacio en blanco y luego por un número, un símbolo (matemáticas, signos de moneda, dingbats, etc.) o una palabra con la primera letra en mayúscula.
-
ABBR_NUM
Un nuevo segmento no se creará si la abreviatura es seguida por un espacio en blanco y luego por un número.
-
-
-
Guarde el archivo .XLSX editado.
Editar archivos .SRX es un proceso complejo adecuado solo para usuarios experimentados en el uso de expresiones regulares
Hay varias reglas que se pueden cambiar en un archivo SRX:
-
Importar texto de un archivo XLSX sin segmentación; una celda es igual a un segmento.
-
Importar texto con un salto de línea para dividir un segmento en dos.
-
Usar dos puntos (o cualquier otro carácter) como separador de segmentos.
-
Prohibir el uso de un punto y coma (o cualquier otro carácter) como separador de segmentos.
-
Eliminar una abreviatura de la lista (el texto será segmentado).
Estas reglas son basadas en caracteres; solo se puede usar un solo carácter como separador de segmentos. Grupos de caracteres (por ejemplo: <p>) no pueden ser usados como separador de segmentos.
Para editar un archivo SRX, sigue estos pasos:
-
Abre el archivo en un editor de texto como Notepad ++.
-
Edita usando expresiones regulares o elimina la segmentación interna completamente.
Ejemplo:
-
<regla romper="no">
La lista de reglas, donde el segmento no será roto. Es decir, una lista de abreviaturas
-
<rule> <beforebreak>
Una expresión regular para un carácter antes de un quiebre (por ejemplo, al final de una oración ". ? ! :"). Si, por ejemplo, no quieres segmentar texto después de un dos puntos, simplemente elimina
:
de cada<regla><antes de romper>
código. -
<regla> <después de romper>
Una expresión regular para un carácter después de un quiebre (por ejemplo, al inicio de una nueva oración; un espacio y letra mayúscula).
-
-
Guardar el archivo SRX modificado.
Para cargar reglas de segmentación modificadas o nuevas, siga estos pasos:
-
Desde la página de configuración
, desplácese hacia abajo hasta la sección y haga clic en Segmentación.
Se abre la página
. -
Haz clic en Nuevo.
Se abre la página
. -
Seleccione un
de la lista desplegable. -
Proporcione un
para la regla. -
Haga clic en Elegir archivo.
Se abre una ventana de selección de archivos.
-
Seleccione el archivo de reglas modificadas para cargar.
-
Marque
si las reglas de segmentación personalizadas serán las reglas de segmentación primarias para el idioma seleccionado. -
Haga clic en Crear.
Se abre la página
y la regla se ha agregado a la lista.
Para usar reglas personalizadas en una importación de trabajos o configurar la longitud del segmento objetivo, siga estos pasos:
-
En el paso 8 de crear un trabajo, haga clic en Segmentación y longitud del segmento en la .
Se abre la lista desplegable de opciones
. -
Seleccione las reglas modificadas de la lista desplegable
. -
Opcionalmente, configure un límite para la longitud del segmento objetivo según los requisitos del proyecto (por ejemplo, traducción de subtítulos):
-
Seleccione
e ingrese el porcentaje preferido para limitar la longitud del segmento según el segmento de origen. -
Seleccione
e ingrese el recuento de caracteres para limitar la longitud del segmento por número de caracteres.
-
-
Haga clic en Crear.
El trabajo se crea y se agrega a la lista utilizando las reglas de segmentación especificadas.
Eliminar todas las reglas de segmentación interna de un archivo SRX dejando solo la segmentación básica del párrafo, elemento o celda completa que se está aplicando. Esta regla de segmentación se puede aplicar a todos los tipos de archivos (MS Word, XML, HTML, Excel, etc.).
Ejemplo:
Este ejemplo de XLSX importado con segmentación predeterminada tendrá 3 segmentos: ¡Peter!, ¡Espera!, y Hola.
Si se elimina toda la segmentación interna dejando solo la segmentación básica basada en la Celda, entonces solo hay dos segmentos: ¡Peter! ¡Espera! y Hola.
Edita el archivo SRX para eliminar todas las reglas de segmentación predeterminadas, es decir, el código entre <!-- reglas de ruptura -->
y </languagerule>
.
Ejemplo:
El encadenamiento puede hacer que este ejemplo no funcione. En tal caso, abre el archivo SRX editado en Notepad++, encuentra los dos atributos del elemento encabezado
y cambia ambos a no
.