Segmentación es la división de textos fuente en partes más pequeñas. Esto mejora la recuperación del texto ya traducido de una memoria de traducción. Los segmentos se presentan en el editor y se pueden filtrar.
Las reglas de segmentación predeterminadas corresponden con los detalles de cada idioma admitido y se pueden personalizar.
Los trabajos importados con segmentación deficiente, como archivos de documentos mal formateados o la aplicación de una personalización de segmentación inapropiada, pueden afectar a los valores de concordancia TM.
Ejemplo:
Buena segmentación:
-
Se admiten memorias de traducción con idiomas meta multilingües y se pueden utilizar de forma bidireccional.
Valor de concordancia del 100%.
Mala segmentación
-
Se admiten memorias de traducción con idiomas meta multilingües.
Valor de concordancia del 100%.
-
y se puede utilizar de forma bidireccional.
Valor de concordancia del 63%.
Se pueden aplicar reglas de segmentación personalizadas a los trabajos y plantillas proyectos. Si un proyecto requiere una regla de segmentación personalizada, será necesario crear una plantilla para ese proyecto. Cuando se establecen como principales, se aplican reglas de segmentación personalizadas a todos los trabajos nuevos importados para ese idioma fuente.
Hay dos tipos de reglas de segmentación:
-
Abreviaturas de archivo .XLSX
-
Expresión regular de archivos .SRX
Para usar reglas personalizadas, descargue las reglas predeterminadas, modifíquelas, cargue el archivo modificado y luego aplíquelas a trabajos especificados.
Precaución
Al agregar reglas de segmentación personalizadas para un idioma fuente CJK sin espacio (mientras que un idioma meta usará espacios como delimitador de palabras), asegúrate de que se añadan espacios iniciales o finales a los segmentos meta divididos por la regla personalizada; esto delimita las palabras en la traducción. Si bien esto sucede automáticamente en segmentos formados por las reglas de segmentación predeterminadas, no se agregan espacios en segmentos divididos manualmente ni en aquellos formados por reglas de segmentación personalizadas adicionales.
Para descargar las reglas de segmentación predeterminadas, sigue estos pasos:
-
Desde la página de configuración , ve hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Selecciona el idioma que se personalizará y haz clic en Exportar XLSX/SRX.
Se abre la ventana
. -
Seleccionar formato:
-
XLSX proporciona una lista abreviada.
-
SRX proporciona reglas de expresión regulares.
-
-
Selecciona un idioma de la lista desplegable.
-
Haz clic en Descargar.
El archivo se descarga en su sistema.
Para descargar una regla de segmentación cargada anteriormente que has cargado anteriormente, sigue estos pasos:
-
Desde la página de configuración , ve hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Haz clic en el icono de configuración de la derecha y elige Personalizar columnas:
-
Habilitar la columna Nombre de archivo
-
Haz clic en un nombre de archivo para descargar una regla preguardada.
Se pueden especificar abreviaturas para idiomas individuales después de los cuales no se deben crear nuevos segmentos.
Para editar abreviaturas, sigue estos pasos:
-
Abre el archivo .XLSX descargado en un editor.
-
Cambia el contenido con el siguiente formato:
El archivo XLSX debe tener dos columnas sin encabezados.
-
Columna 1: Abreviatura a especificar
-
Columna 2: Especificación del comportamiento de segmentación
-
ABBR_UPPER_NUM
No se creará un nuevo segmento si la abreviatura va seguida de un espacio en blanco y luego de un número, un símbolo (matemáticas, signos monetarios, dingbats, etc.) o una palabra con la primera letra en mayúscula.
-
ABBR_NUM
No se creará un nuevo segmento si la abreviatura va seguida de un espacio en blanco y después de un número.
-
-
-
Guarda el archivo .XLSX editado.
La edición de archivos .SRX es un proceso complejo adecuado solo para usuarios con experiencia en el uso de expresiones regulares
Hay varias reglas que se pueden cambiar en un archivo SRX:
-
Importar texto de un archivo XLSX sin segmentación; una celda es igual a un segmento.
-
Importar texto con una nueva línea con orden de dividir un segmento en dos.
-
Usa un punto (o cualquier otro carácter) como separador de segmentos.
-
Prohibir usar punto y coma (o cualquier otro carácter) como separador de segmentos.
-
Eliminar una abreviatura de la lista (el texto se segmentará).
Estas reglas se basan en caracteres; solo se puede utilizar un único carácter como separador de segmentos. No se pueden utilizar grupos de caracteres (por ejemplo: <p>) como separador de segmentos.
Para editar un archivo SRX, sigue estos pasos:
-
Abre el archivo en un editor como Notepad ++.
-
Editar usando expresiones regulares o eliminar completamente la segmentación interna.
Ejemplo:
-
<salto de regla="no">
La lista de reglas, donde no se romperá el segmento. Es decir, una lista de abreviaturas
-
<rule> <beforebreak>
Una expresión regular para un carácter antes de un descanso (por ejemplo, al final de una frase ". ? ! :"). Si, por ejemplo, no quieres texto segmento después de un punto, simplemente elimina
:
de cada código<regla><beforebreak>
. -
<rule> <afterbreak>
Expresión regular de un carácter después de un descanso (por ejemplo, al principio de una nueva frase; un espacio y una mayúscula).
-
-
Guarda el archivo SRX modificado.
Para cargar reglas de segmentación modificadas o nuevas, sigue estos pasos:
-
Desde la página de configuración , ve hasta la sección y haz clic en Segmentación.
Se abre la página
. -
Haz clic en Nuevo.
Se abre la página
SRX Segmentación. -
Selecciona un
en la lista desplegable. -
Proporciona un
para la regla. -
Haz clic en Seleccionar archivo.
Se abre una ventana de selección de archivos.
-
Selecciona el archivo de reglas modificadas que cargar.
-
Comprueba
si las reglas de segmentación personalizadas serán las reglas de segmentación primarias para el idioma seleccionado. -
Haz clic en Crear.
Se abre la página
y se ha añadido la regla a la lista.
Para usar reglas personalizadas al importar un trabajo, sigue estos pasos:
-
Al paso 8 de la creación de un trabajo, haga clic en Segmentación y longitud de segmento de la .
Se abre el desplegable Opciones de
. -
Selecciona las reglas modificadas de la lista desplegable
. -
Haz clic en Crear.
El trabajo se crea y agrega a la lista utilizando las reglas de segmentación especificadas.
Eliminar todas las reglas de segmentación interna de un archivo SRX, dejando solo la segmentación básica de todo el párrafo, elemento o celda que se esté aplicando. Esta regla de segmentación se puede aplicar a todos los tipos de archivo (MS Word, XML, HTML, Excel, etc.).
Ejemplo:
Este ejemplo XLSX importado con segmentación predeterminada tendrá 3 segmentos: Peter!, Wait!, y Hello.
Si se elimina toda segmentación interna dejando solo la segmentación básica basada en la Celda, entonces solo hay dos segmentos: Peter! Espera! y Hola.
Edita el archivo SRX para eliminar todas las reglas de segmentación predeterminadas, es decir, el código entre <!-- break rules -->
y </languagerule>
.
Ejemplo:
La caída en cascada puede hacer que este ejemplo no trabajo. En tal caso, abra el archivo SRX editado en el Bloc de notas++, busque los dos atributos del elemento de encabezado
y cambie ambos a no
.