Управление проектом

Анализ (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Анализ рассчитывает количество символов и слов в выбранных файлах и выявляет средние символы на слово, повторы, непереводимые элементы, совпадения из памяти переводов, внутренние неточные совпадения и совпадения машинного перевода. Анализ также может показать количество правок, внесенных редактором.

Анализы могут создавать менеджеры проектов или администраторы. Лингвистам нельзя давать возможность самим проводить анализы. Поставщики могут создавать анализы для совместных заданий/проектов.

В некоторых CAT-инструментах анализ называется статистикой.

Организационная аналитика обеспечивается с помощью аналитической панели.

Поскольку в разных странах используются разные единицы оплаты, доступны три метода расчета:

  • Символы 

    Без пробелов.

  • Слова 

    Для языков, использующих пробелы между словами — исключая китайский, японский и тайский.

  • Страницы 

    1800 символов с пробелами — без привязки к фактическому количеству страниц в файле.

Количество слов

Из-за разных методов подсчета на разных языках количество слов в представленном виде может не совпадать с количеством слов в других приложениях.

  • Каждый тег объединения заменяется одним пробелом.

  • Другие теги удалены.

В языках, использующих пробел для разделения слов (например, английский):

  • Каждая последовательность чисел, включая +-,.. заменяется одним символом (используется выражение regexp [+-]?[0-9]+([., -]?[0-9]++)*+).

  • Каждая последовательность пробелов заменяется одним пробелом.

  • Удаляются пробелы в начале и конце сегмента.

  • Каждая последовательность символов, отличных от пробела, считается за одно слово.

В языках, не использующих пробел для разделения слов (например, японский):

  • Некоторые знаки препинания удалены из текста (используется выражение regexp [\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]).

  • Сегмент разбивается на последовательности символов, относящихся к не пробелам (NWS), ханьскому, хираганскому, катаканскому и тайскому письмам, и последовательности символов, не относящихся к этим письмам (WS).

  • Общее количество слов = (количество слов из СЯС) + (количество слов из СЯС).

  • Количество слов из WS рассчитывается как для английского языка.

  • Количество слов для NWS — это количество символов без пробелов.

Примечание

Символы из языков CJK считаются и как символы, и как слова.

Создать анализ

Чтобы создать анализ, выполните следующие действия.

  1. На странице проекта выберите одно или несколько заданий.

  2. Нажмите «Анализ».

    Откроется окно Анализа.

  3. Выберите Тип в раскрывающемся списке.

  4. Если необходимо, укажите имя.

    • Доступные макросы для именования при анализе:

      • {projectName}

      • {sourceLang}

        Добавлен язык исходника

      • {targetLang}

        Добавляет язык перевода. При анализе нескольких языков язык будет пустым.

      • {userName}

        Добавлено имя пользователя назначенного лингвиста или исполнителя. Если назначено несколько Лингвистов, имя будет пустым.

      • {workflow}

      • {innerId}

      • {fileName}

        Если для анализа используется больше файлов/заданий, {имя файла} будет пустым.

  5. Выберите параметры анализа. В частности:

    • Применение опции Исключить числа повлияет на количество слов, так как числа не будут рассчитываться как слова.

    • Опция «Включить внутренние нечеткие элементы» сравнивает сегменты в анализируемом задании на сходство в файле и сравнивает их только с ТМ.

      Если помечены отдельные внутренние неточные совпадения, то во вновь созданных анализах они отображаются как отдельная категория. Например:

      Задание по переводу с 10 исходными словами включает следующие сегменты, в которых отличается только последний символ:

      • Я купил новую машину.

      • Я купил новую машину!

      В случае, если в ТМ не найдено совпадений, в анализе по умолчанию будут отображаться:

      Параметры IF

      Категория ТМ: 0%-49%

      Категория ТМ: 95%-99%

      Категория IF: 95%-99%

      Включить ЕСЛИ отключено

      10 слов

      Включить ЕСЛИ включен + Отдельно ЕСЛИ отключено

      5 слов

      5 слов

      Включить IF + Разделить IF

      5 слов

      5 слов

  6. Нажмите «Анализ».

    Анализ или анализы добавлены в список.

  7. Нажмите на анализ в списке, чтобы просмотреть его в простой таблице или скачать для отображения в приложении по управлению проектами.

Примечание

Параметры анализа можно задать при создании анализа, на или на глобальном уровне в разделе Настройки Setup_gear.png.

Предусмотрены три типа анализа:

Анализ по умолчанию

Анализ по умолчанию — это стандартный анализ исходных сегментов перед переводом. В нем содержится базовый анализ задания, который можно использовать с анализом постредактирования, чтобы определить, сколько усилий было затрачено на перевод этого задания. Этот базовый уровень также используется в качестве основы для формирования расценок для клиентов.

Выполняется разбивка количества сегментов/слов/символов, и в случае использования в проекте выявляются совпадения из памяти переводов, а также непереводимые совпадения, внутренние неточные совпадения и QPS (если этот параметр включен).

Анализ по умолчанию после перевода выдает неверный анализ.

Анализ постредактирования

Анализ постредактирования выполняется в целевых сегментах с указанием усилий по редактированию; объема редактирования текста, которое требуется от лингвиста или корректора. Запуск выполняется после завершения постредактирования.

Когда лингвист кликает на не переведенный сегмент, текущее наибольшее совпадение из памяти переводов, машинный перевод и/или непереводимое совпадение сохраняется для этого сегмента и используется в анализе постредактирования.

Анализ постредактирования может быть запущен с любого этапа рабочего процесса и рассчитывается как разница между текстом, вставленным из доступного исходника (например, ТМ/MT), и отредактированным результатом в переводе сегмента.

Анализ постредактирования расширяет рамки традиционного анализа памяти переводов, включая машинный перевод (MT) и непереводимые элементы (NT).

Варианты постанализа

Варианты постредактирования используются для расчета усилий, необходимых для постредактирования совпадений из памяти переводов (TM), непереводимых элементов (NT) и машинного перевода (MT).

Анализ ТМ включен

  • Предназначены для низкокачественных ТМ с высоким процентом совпадений, требующих редактирования лингвистом.

  • Указывает усилия по постредактированию ТМ.

  • Содержит в анализе только 100% совпадения. Контекстные 101% совпадения из ТМ никак не влияют на расчет.

Анализ ТМ отключен

  • Предназначена для высококачественных ТМ, в которых совпадения следует редактировать как можно реже, чтобы снизить стоимость.

  • Указывает как 101%, так и 100%.

  • Указывает на совпадения ТМ, предлагаемые Лингвисту при открытии сегмента (а не на фактические усилия Лингвиста по постредактированию).

  • Указывает усилия по постредактированию машинного перевода и непереводимых элементов.

Анализ NT/MT после редактирования включен

  • Если рекомендация MT или NT была принята без дальнейшего редактирования, то при анализе она совпадает на 100%.

  • Если Лингвист изменит машинный перевод, процент совпадений будет ниже. Алгоритм подсчета баллов аналогичен алгоритму подсчета нечетких совпадений из памяти переводов.

  • При редактировании NT сегмент будет представлен как 0-49% NT.

Анализ отключенного постредактирования NT/MT

  • Записи от MT/NT без какой-либо предполагаемой оценки будут считаться совпадениями ТМ 0%-49%. Они будут помечены как переведенные лингвистом, при этом машинный перевод не будет рассмотрен.

  • Совпадения QPS и Phrase Language AI, превышающие 75%, будут совпадать в столбце машинного перевода.

Автоматически генерировать анализ постредактирования перед обновлением исходника

  • Создается анализ:

    • За каждое обновленное задание.

    • для каждого отдельного поставщика в отдельности и назначается для этого соответствующего поставщика.

  • Анализ не создается, если:

    • Лингвист или исполнитель не назначен.

  • Количество подтвержденных и переведенных сегментов.

  • Анализ проводится в соответствии с правилами присвоения имен:

    • UpdateSource #{innerID}{workflow}

  • Будет создан анализ с использованием подсчитанных единиц (исходных), анализа постредактирования NT, анализа постредактирования TM и анализа постредактирования MT.

Единицы подсчета

  • исходник/цель

    Выберите, какое количество слов будет представлено в анализе. Количество слов в переводе может превышать количество слов в исходном тексте.

    Не влияет на оценку матчей.

Сравнить анализ

Доступно для

  • Планы Team, Ultimate и Enterprise (Legacy)

Свяжитесь с отделом продаж для вопросов лицензирования.

Функция сравнения анализа доступна только в проектах с этапами рабочего процесса. Он сравнивает две версии файла на разных этапах рабочего процесса на уровне сегмента и анализирует, чем отличаются две версии. Если параметры анализа для конкретного проекта отсутствуют, используются настройки по умолчанию, которые могут привести к неверным отчетам.

Пример

Сопоставление этапов перевода и редактирования показывает фактические усилия редактора путем определения того, насколько изменился перевод на этапе редактирования.

Анализ может выполняться по нескольким заданиям и может группироваться двумя способами:

  • Анализ по поставщику 

    • Для проекта с большим количеством заданий, назначенных различным лингвистам или поставщикам. Раньше:

      • Создайте отдельный анализ, содержащий файлы, назначенные отдельным лингвистам или исполнителям.

      • Вы можете поручить поставщику аналитических услуг сделать их доступными для своих лингвистов/поставщиков.

      Схема расчета с учетом правок будет выбрана в качестве опции в случае ее применения к поставщику.

  • Анализ по языкам 

    • Если проект содержит несколько языков перевода, анализ всех файлов можно выполнить в пакетном режиме, создав отдельный анализ для каждого отдельного языка.

      Чтобы проанализировать по языкам, выполните следующие действия:

      1. На странице проекта выберите все файлы задания.

      2. Нажмите «Анализ».

        Откроется окно Анализа.

      3. Сохраняйте настройки по умолчанию и выберите «Анализ по языкам».

      4. Нажмите «Анализ».

        Анализ заданий составляется по языкам.

Пересчет анализа

Если исходный файл, используемый для анализа, обновляется, то в аналитической таблице он указывается как устаревший yellow_warning.jpg.

При пересчете применяются настройки, использованные для исходного анализа.

Поставщики не могут пересчитывать анализы, созданные покупателями.

Чтобы пересчитать с использованием нового исходного файла, выполните следующие действия.

  1. Выберите устаревшие анализы

  2. Нажмите Пересчитать.

    Окно анализа Пересчитать открывается до обработки пересчета. При закрытии пересчет завершается, и устаревший индикатор очищается.

Настройка вида анализа

Сегменты, страницы, слова, символы и проценты можно отобразить/скрыть в таблице анализа. Столбец Времени редактирования также доступен для анализа после редактирования и показывает, сколько секунд было потрачено на редактирование сегмента.

Скачать анализ

Чтобы скачать анализ, выполните следующие действия:

  1. Нажмите Скачать, чтобы представить раскрывающееся меню и выберите:

    • CSV (разделенные запятыми значения) с символами или без символов и читается в приложениях электронной таблицы.

    • LOG (аналогично формату SDL Trados) и читается большинством приложений для управления проектами.

    • JSON (JavaScript Object Notation), облегченный формат обмена данными.

    Только анализ, загруженный в формате JSON, будет включать разбивку данных NT, MT, TM и внутренней нечеткости (IF) по типу совпадения. 

  2. Выбор типа файла запускает загрузку.

Эти файлы можно импортировать в большинство программных систем управления проектами.

Применить схему чистых ставок

Вы можете применить скидку к словам/символам/страницам в анализе. Объем перевода со скидкой тут же рассчитывается и отображается непосредственно в анализе в строке «Чистая ставка».

Чтобы удалить из анализа схему чистых ставок, оставьте поле рядом с кнопкой Применить чистую ставку пустым.

Когда к анализу применяется схема чистых ставок, загруженный файл с анализом показывает взвешенное количество слов в каждой категории соответствия.

Назначить поставщика для анализа

Чтобы назначить анализ поставщику, выполните следующие действия.

  1. Выберите анализ из списка и нажмите «Редактировать».

    Открывается страница редактирования.

  2. Выберите Поставщика в раскрывающемся списке.

  3. Нажмите Сохранить.

    Анализ будет доступен назначенному поставщику на портале лингвистов.

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.