Gestión de proyectos

Segmentation Rules (TMS)

El contenido se traduce automáticamente del inglés por Phrase Language AI.

Segmentación

Segmentación es la división de textos fuente en partes más pequeñas. Esto mejora la recuperación del texto ya traducido de una memoria de traducción. Los segmentos se presentan en el editor y se pueden filtrar.

Las reglas de segmentación predeterminadas corresponden con los detalles de cada idioma admitido y se pueden personalizar.

Los trabajos importados con segmentación deficiente, como archivos de documentos mal formateados o la aplicación de una personalización de segmentación inapropiada, pueden afectar a los valores de concordancia TM.

Ejemplo:

Buena segmentación:

  • Se admiten memorias de traducción con idiomas meta multilingües y se pueden utilizar de forma bidireccional.

    Valor de concordancia del 100%.

Mala segmentación

  • Se admiten memorias de traducción con idiomas meta multilingües.

    Valor de concordancia del 100%.

  • y se puede utilizar de forma bidireccional.

    Valor de concordancia del 63%.

Personalizar reglas de segmentación

Se pueden aplicar reglas de segmentación personalizadas a los trabajos y plantillas proyectos. Si un proyecto requiere una regla de segmentación personalizada, será necesario crear una plantilla para ese proyecto. Cuando se establecen como principales, se aplican reglas de segmentación personalizadas a todos los trabajos nuevos importados para ese idioma fuente.

Hay dos tipos de reglas de segmentación:

  • Abreviaturas de archivo .XLSX

  • Expresión regular de archivos .SRX

Para usar reglas personalizadas, descargue las reglas predeterminadas, modifíquelas, cargue el archivo modificado y luego aplíquelas a trabajos especificados.

Precaución

Al agregar reglas de segmentación personalizadas para un idioma fuente CJK sin espacio (mientras que un idioma meta usará espacios como delimitador de palabras), asegúrate de que se añadan espacios iniciales o finales a los segmentos meta divididos por la regla personalizada; esto delimita las palabras en la traducción. Si bien esto sucede automáticamente en segmentos formados por las reglas de segmentación predeterminadas, no se agregan espacios en segmentos divididos manualmente ni en aquellos formados por reglas de segmentación personalizadas adicionales.

Descargar reglas de segmentación predeterminadas

Para descargar las reglas de segmentación predeterminadas, sigue estos pasos:

  1. Desde la página Setup_gear.png de configuración , ve hasta la sección Configuración del proyecto y haz clic en Segmentación.

    Se abre la página Segmentación.

  2. Selecciona el idioma que se personalizará y haz clic en Exportar XLSX/SRX.

    Se abre la ventana Exportar XLSX/SRX.

  3. Seleccionar formato:

    • XLSX proporciona una lista abreviada.

    • SRX proporciona reglas de expresión regulares.

  4. Selecciona un idioma de la lista desplegable.

  5. Haz clic en Descargar.

    El archivo se descarga en su sistema.

Para descargar una regla de segmentación cargada anteriormente que has cargado anteriormente, sigue estos pasos:

  1. Desde la página Setup_gear.png de configuración , ve hasta la sección Configuración del proyecto y haz clic en Segmentación.

    Se abre la página Segmentación.

  2. Haz clic en el icono de configuración de la derecha y elige Personalizar columnas: customize-segmentation-columns.png

  3. Habilitar la columna Nombre de archivo

  4. Haz clic en un nombre de archivo para descargar una regla preguardada.

Editar Abreviaturas en un archivo .XLSX

Se pueden especificar abreviaturas para idiomas individuales después de los cuales no se deben crear nuevos segmentos.

Para editar abreviaturas, sigue estos pasos:

  1. Abre el archivo .XLSX descargado en un editor.

  2. Cambia el contenido con el siguiente formato:

    El archivo XLSX debe tener dos columnas sin encabezados.

    • Columna 1: Abreviatura a especificar

    • Columna 2: Especificación del comportamiento de segmentación

      • ABBR_UPPER_NUM

        No se creará un nuevo segmento si la abreviatura va seguida de un espacio en blanco y luego de un número, un símbolo (matemáticas, signos monetarios, dingbats, etc.) o una palabra con la primera letra en mayúscula.

      • ABBR_NUM

        No se creará un nuevo segmento si la abreviatura va seguida de un espacio en blanco y después de un número.

  3. Guarda el archivo .XLSX editado.

Editar expresiones regulares en un archivo .SRX

La edición de archivos .SRX es un proceso complejo adecuado solo para usuarios con experiencia en el uso de expresiones regulares

Hay varias reglas que se pueden cambiar en un archivo SRX:

  • Importar texto de un archivo XLSX sin segmentación; una celda es igual a un segmento.

  • Importar texto con una nueva línea con orden de dividir un segmento en dos.

  • Usa un punto (o cualquier otro carácter) como separador de segmentos.

  • Prohibir usar punto y coma (o cualquier otro carácter) como separador de segmentos.

  • Eliminar una abreviatura de la lista (el texto se segmentará).

Estas reglas se basan en caracteres; solo se puede utilizar un único carácter como separador de segmentos. No se pueden utilizar grupos de caracteres (por ejemplo: <p>) como separador de segmentos.

Para editar un archivo SRX, sigue estos pasos:

  1. Abre el archivo en un editor como Notepad ++.

  2. Editar usando expresiones regulares o eliminar completamente la segmentación interna.

    Ejemplo:

    BreakRules_Example.png
    • <salto de regla="no">

      La lista de reglas, donde no se romperá el segmento. Es decir, una lista de abreviaturas

    • <rule> <beforebreak>

      Una expresión regular para un carácter antes de un descanso (por ejemplo, al final de una frase ". ? ! :"). Si, por ejemplo, no quieres texto segmento después de un punto, simplemente elimina : de cada código <regla><beforebreak>.

    • <rule> <afterbreak>

      Expresión regular de un carácter después de un descanso (por ejemplo, al principio de una nueva frase; un espacio y una mayúscula).

  3. Guarda el archivo SRX modificado.

Cargar nuevas reglas de segmentación

Para cargar reglas de segmentación modificadas o nuevas, sigue estos pasos:

  1. Desde la página Setup_gear.png de configuración , ve hasta la sección Configuración del proyecto y haz clic en Segmentación.

    Se abre la página Segmentación.

  2. Haz clic en Nuevo.

    Se abre la página Cargar XLSX personalizado o SRX Segmentación.

  3. Selecciona un idioma en la lista desplegable.

  4. Proporciona un Nombre para la regla.

  5. Haz clic en Seleccionar archivo.

    Se abre una ventana de selección de archivos.

  6. Selecciona el archivo de reglas modificadas que cargar.

  7. Comprueba primario si las reglas de segmentación personalizadas serán las reglas de segmentación primarias para el idioma seleccionado.

  8. Haz clic en Crear.

    Se abre la página Segmentación y se ha añadido la regla a la lista.

Usar reglas de segmentación personalizadas al importar trabajos

Para usar reglas personalizadas al importar un trabajo, sigue estos pasos:

  1. Al paso 8 de la creación de un trabajo, haga clic en Segmentación y longitud de segmento de la configuración Importar archivo.

    Se abre el desplegable Opciones de segmentación y longitud.

  2. Selecciona las reglas modificadas de la lista desplegable Reglas segmentación fuente.

  3. Haz clic en Crear.

    El trabajo se crea y agrega a la lista utilizando las reglas de segmentación especificadas.

Ejemplo de segmentación cambiante (1 segmento celular 1)

Eliminar todas las reglas de segmentación interna de un archivo SRX, dejando solo la segmentación básica de todo el párrafo, elemento o celda que se esté aplicando. Esta regla de segmentación se puede aplicar a todos los tipos de archivo (MS Word, XML, HTML, Excel, etc.).

Ejemplo:

A

B

1

¡Peter! ¡Espera!

2

Hola.

3

Este ejemplo XLSX importado con segmentación predeterminada tendrá 3 segmentos: Peter!, Wait!, y Hello.

Si se elimina toda segmentación interna dejando solo la segmentación básica basada en la Celda, entonces solo hay dos segmentos: Peter! Espera! y Hola.

Edita el archivo SRX para eliminar todas las reglas de segmentación predeterminadas, es decir, el código entre <!-- break rules --> y </languagerule>.

Ejemplo:

1cell-1segment-srx.png

La caída en cascada puede hacer que este ejemplo no trabajo. En tal caso, abra el archivo SRX editado en el Bloc de notas++, busque los dos atributos del elemento de encabezado y cambie ambos a no.

¿Fue útil este artículo?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.