Анализ вычисляет количество символов и слов в выбранных файлах и определяет:
-
Повторения (включая повторения между файлами)
-
Непереводимые элементы
-
Внутренние неточные совпадения
Анализы также могут показать количество исправлений, внесенных редактором.
Анализы могут быть созданы менеджерами проектов или администраторами. Лингвистам не разрешается проводить собственные анализы. Поставщики могут создавать анализы для совместных работ/проектов.
Некоторые CAT-инструменты называют анализ статистикой.
Организационная аналитика предоставляется панелью аналитики.
Поскольку в разных странах используются разные единицы расчета, доступны три метода расчета:
-
Символы
Без пробелов.
-
Слова
Для языков, которые используют пробелы между словами — исключая китайский, японский и тайский.
-
Страницы
1800 символов с пробелами — не относящихся к фактическому количеству страниц в файле.
Из-за различных методов подсчета слов в разных языках, количество слов, как представлено, может не совпадать с количеством слов, полученным другими приложениями.
Количество слов для анализа отличается от расчета MTU.
-
Каждый тег объединения заменяется одним пробелом.
-
Другие теги удаляются.
В языках, использующих пробел для разделения слов (например, английский):
-
Каждая последовательность чисел, включая
+-,., заменяется одним символом (с использованием регулярного выражения[+-]?[0-9]+([., -]?[0-9]++)*+). -
Каждая последовательность пробелов заменяется одним пробелом.
-
Пробелы в начале и в конце сегмента удаляются.
-
Каждая последовательность символов, отличных от пробела, считается одним словом.
В языках, не использующих пробелы для разделения слов (например, японский):
-
Некоторые знаки препинания удаляются из текста (с использованием регулярного выражения
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]). -
Сегмент разбивается на последовательности символов, принадлежащих к не пробельным (NWS) иероглифам, хирагане, катакане и тайским письменностям, и последовательности символов, не принадлежащих к этим письменностям (WS).
-
Общее количество слов = (количество слов из NWS) + (количество слов из WS).
-
Количество слов из WS вычисляется так же, как для английского.
-
Количество слов для NWS - это количество символов без пробелов.
-
Для тайского языка количество слов - это количество символов без пробелов, деленное на 2.
Примечание
Символы из языков CJK считаются как символами, так и словами.
Чтобы создать анализ, выполните следующие шаги:
-
На странице выберите одну или несколько .
-
Нажмите Анализировать.
Окно открывается.
-
Выберите из выпадающего списка.
-
При необходимости укажите имя.
-
Доступные макросы для именования анализа:
-
{projectName} -
{sourceLang}Добавляет язык оригинала
-
{targetLang}Добавляет язык перевода. Если анализируется несколько языков, язык будет пустым.
-
{userName}Добавляет имя пользователя назначенного лингвиста или исполнителя. Если назначено несколько лингвистов, имя будет пустым.
-
{рабочий процесс} -
{innerId} -
{fileName}Если для анализа используется больше файлов/заданий,
{имя файла}будет пустым.
-
-
-
Выберите параметры анализа. В частности:
-
Применение опции повлияет на количество слов, так как числа не будут учитываться как слова.
-
Опция сравнивает сегменты в анализируемом задании на наличие сходств в файле, а не только сравнивает их с памятью переводов (TM).
Если отмечены, внутренние нечеткие совпадения отображаются как отдельная категория в вновь созданных анализах. Например:
Перевод задания с 10 исходными словами включает в себя следующие сегменты, где только последний символ отличается:
-
Я купил новую машину.
-
Я купил новую машину!
В случае, если совпадения не найдены в памяти переводов (TM), будет отображен анализ по умолчанию:
Параметры IF
Категория TM: 0%-49%
Категория TM: 95%-99%
Категория IF: 95%-99%
Включить IF отключено
10 слов
Включить IF включено + Отдельный IF отключено
5 слов
5 слов
Включить IF + Отдельный IF включено
5 слов
5 слов
-
-
-
Нажмите Анализировать.
Анализ или анализы добавляются в список.
-
Нажмите на анализ в списке, чтобы просмотреть его на странице деталей или скачать его для использования в приложении управления проектами.
Примечание
Параметры анализа могут быть установлены при создании анализа, на уровне проекта или глобально в разделе Настройки .
Предоставляется три типа анализа:
Анализ по умолчанию — это стандартный анализ, проводимый на исходных сегментах перед переводом. Он предоставляет базовый анализ задания, который можно использовать с анализом постредактирования, чтобы определить, сколько усилий было вложено в перевод этого задания. Эта базовая линия также используется в качестве основы для генерации цитат для клиентов.
Порог TM, установленный в предварительном переводе, используется по умолчанию, но может быть изменен при необходимости.
Производится разбивка по количеству сегментов/слов/символов, и если используется в проекте, идентифицируются совпадения TM вместе с непереводимыми, внутренними неточными совпадениями и QPS (если включено).
Важно
Запуск анализа по умолчанию после перевода приводит к неправильным анализам.
Анализ постредактирования выполняется на целевых сегментах и указывает на усилия по редактированию; сколько редактирования текст потребовал от лингвиста или корректора. Он выполняется после завершения постредактирования.
Когда лингвист нажимает на непереведенный сегмент, текущее наивысшее совпадение памяти переводов, предложение машинного перевода и/или непереводимое сохраняется для этого сегмента и используется в анализе постредактирования.
Анализ постредактирования может быть запущен с любого этапа рабочего процесса и рассчитывается как разница между текстом, вставленным из доступного источника (например, TM/MT), и результатом постредактирования в целевом сегменте.
Анализ постредактирования расширяет традиционный анализ памяти переводов, включая машинный перевод (MT) и непереводимые (NT). Сторонние MT-движки также поддерживаются.
Важно
Отключение и не исключает совпадения TM/MT из анализа. В этом случае анализ учитывает оценку более высокого доступного совпадения вместо усилий по постредактированию.
Результат 101% TM в анализе постредактирования не обязательно означает, что сегмент был переведен из TM.
Пример
Задание, переведенное с использованием MT, все еще может отображаться как 101% TM, если отключен и совпадение 101% TM было доступно, когда сегмент был открыт.
Опции постанализа
Опции постредактирования используются для расчета усилий по постредактированию, необходимых для совпадений из памяти переводов (TM), непереводимых (NT) и машинного перевода (MT).
Анализ TM постредактирования включен
-
Предназначено для низкокачественных ТМ, которые содержат высокий процент совпадений, требующих редактирования лингвистом.
-
Указывает на усилия по постредактированию для ТМ.
-
Содержит только 100% совпадения в анализе. Совпадения 101% из ТМ не влияют на расчет.
Анализ ТМ, постредактирование отключено
-
Предназначено для высококачественной ТМ, где совпадения должны редактироваться как можно меньше, чтобы снизить стоимость.
-
Указывает как на 101%, так и на 100%.
-
Указывает на совпадения ТМ, предлагаемые лингвисту при открытии сегмента (не фактические усилия по постредактированию лингвиста).
-
Указывает на усилия по постредактированию для машинного перевода и непереводимых.
Анализ НТ/МТ, постредактирование включено
-
Если предложение МТ или НТ было принято без дальнейшего редактирования, оно представляется как 100% совпадение в анализе.
-
Если лингвист изменяет МТ, процент совпадения будет ниже. Алгоритм подсчета оценок такой же, как и тот, который используется для расчета оценки нечетких совпадений памяти переводов.
-
Редактирование НТ приведет к тому, что сегмент будет представлен как 0-49% НТ.
Анализ НТ/МТ, постредактирование отключено
-
Записи из МТ/НТ без какой-либо оценочной оценки будут считаться совпадениями ТМ 0%-49%. Они будут указаны как переведенные лингвистом с учетом МТ.
-
Оценка качества (QPS) и Фраза Language AI совпадения выше 75% будут находиться в колонке МТ в соответствующих совпадениях.
-
Указывает на совпадения НТ/МТ, предлагаемые лингвисту при открытии сегмента (не фактические усилия по постредактированию лингвиста).
Автоматически генерировать анализ постредактирования перед обновлением источника
-
Анализ создается:
-
Для каждого обновленного задания.
-
Для каждого отдельного поставщика индивидуально и назначенного этому поставщику.
-
-
Анализ не создается, если:
-
Ни один лингвист или исполнитель не назначен.
-
-
Анализ учитывает подтвержденные и переведенные сегменты.
-
Анализ следует соглашению о наименовании:
-
Обновить источник #{innerID}{рабочий процесс}
-
-
Анализ будет создан с Подсчитанные единицы (оригинал), Анализировать непереводимые постредактирования, Анализировать постредактирование памяти переводов (TM) и Анализировать постредактирование машинного перевода (МТ) выбранными.
Подсчитать единицы
-
Выберите, какое количество слов будет представлено в анализе. Количество слов в переводе может быть больше, чем количество слов в оригинале.
Не влияет на оценку совпадений.
-
планов: Team, Ultimate и Enterprise (устаревшая версия)
Свяжитесь с отделом продаж по вопросам лицензирования.
Функция сравнения анализа доступна только в проектах с этапами рабочего процесса. Она сравнивает две версии файла на разных этапах рабочего процесса на уровне сегментов и анализирует, как две версии отличаются. Если для анализа нет специфических настроек проекта, используются настройки по умолчанию, что может привести к неправильным отчетам.
Пример
Анализ может быть выполнен по нескольким заданиям и может быть сгруппирован двумя способами:
-
Анализ по поставщику
-
Для проекта с множеством заданий, назначенных различным лингвистам или поставщикам. Используется для:
-
Создания отдельных анализов, содержащих файлы, назначенные отдельным лингвистам или поставщикам.
-
Назначения анализов поставщику, делая анализы видимыми для их лингвистов/поставщиков.
Схема расчета чистой ставки будет предварительно выбрана в качестве опции, если она применяется к поставщику.
-
-
-
Анализ по языку
-
Если проект содержит несколько целевых языков, анализы всех файлов могут быть выполнены в пакетном режиме, создавая отдельный анализ для каждого языка.
Чтобы проанализировать по языку, выполните следующие шаги:
-
На странице проекта выберите все файлы .
-
Нажмите Анализировать.
Окно открывается.
-
Сохраните настройки по умолчанию и выберите .
-
Нажмите Анализировать.
Анализ заданий подготавливается по языку.
Примечание
Снимите выбор этой опции, чтобы создать один единственный анализ для многоязычного проекта.
-
-
Когда исходный файл для анализа обновляется, он помечается как устаревший в таблице анализа.
Пересчет применяет настройки, использованные для оригинального анализа.
Поставщики не имеют права пересчитывать анализы, созданные Покупателями.
Чтобы пересчитать с использованием нового исходного файла, выполните следующие шаги:
Настройте вид анализа
Столбцы , , , и могут быть отображены/скрыты в таблице анализа. Столбец также доступен для анализа постредактирования и указывает, сколько секунд было потрачено на редактирование сегмента.
Скачать анализ
Чтобы скачать анализ, выполните следующие шаги:
-
Нажмите Скачать, чтобы открыть выпадающее меню и выберите:
-
CSV (значения, разделенные запятыми) с символами или без и читается с помощью табличных приложений.
-
LOG (похожий на формат SDL Trados) и читается большинством приложений для управления проектами.
-
JSON (JavaScript Object Notation), легкий формат обмена данными.
Только анализ, загруженный в формате JSON, будет включать разбивку данных NT, MT, TM и внутренних нечетких (IF) данных по типу совпадения.
-
-
Выбор типа файла запускает загрузку.
Эти файлы могут быть импортированы в большинство систем управления проектами.
Применить схему расчета чистой ставки
Скидка на слова/символы/страницы может быть применена в анализе. Сразу рассчитывается и отображается объем перевода со скидкой непосредственно в анализе в строке .
Чтобы удалить схему расчета чистой ставки из анализа, оставьте поле рядом с кнопкой пустым.
Когда схема расчета чистой ставки применяется к анализу, загруженный файл с анализом показывает взвешенные подсчеты слов в каждой категории совпадений.
Чтобы назначить анализ поставщику, выполните следующие шаги:
-
Выберите анализ из списка и нажмите Редактировать.
Откроется страница редактирования.
-
Выберите поставщика из выпадающего списка.
-
Нажмите Сохранить.
Анализ будет доступен назначенному поставщику на портале лингвист.