Анализ рассчитывает количество символов и слов в выбранных файлах и выявляет:
-
Средние символы в слове
-
Повторы (включая повторы перекрестных файлов)
-
Непереводимые элементы
-
Внутренние неточные совпадения
-
Предложения машинного перевода
Анализ также может показать количество правок, внесенных редактором.
Анализы могут создавать менеджеры проектов или администраторы. Лингвистам нельзя позволить проводить собственный анализ. Исполнители могут создать анализ совместных заданий/проектов.
В некоторых CAT-Инструменты анализ называется статистикой.
Organizational Analytics обеспечивается панелью управления Analytics.
Поскольку в разных странах используются разные расчетные единицы, доступны три метода расчета:
-
Символы
Без пробелов.
-
Слова
Для языков, использующих пробелы между словами — исключая китайский, японский и тайский.
-
Страницы
1800 символов с пробелами — без привязки к фактическому количеству страниц в файле.
Из-за разных методов подсчета на разных языках количество слов в представленном виде может не совпадать с количеством слов, созданным другими приложениями.
-
Каждый объединенный тег заменяется одним каталогом.
-
Другие tags удалены.
В языках, использующих пробел для разделения слов (например, английский):
-
Каждая последовательность чисел, включая
+-,.
, заменяется одним символом (с использованием выражения regexp[+-]?[0-9]+([., -]?[0-9]++)*+
). -
Каждая последовательность каталогов заменяется одним пробелом.
-
Пробелы в начале и конце сегмента удаляются.
-
Каждая последовательность символов, отличных от каталога, считается за одно слово.
В языках, не использующих пробелы для разделения слов (например, японский):
-
Некоторые знаки препинания удалены из текста (используется регулярное выражение
[\u2000-\u206F\u2E00-\u2E7F\u3000-\u3004\u3006-\u301F\\p{P}]
). -
Сегмент разделен на последовательности символов, принадлежащих не пробелам (NWS) ханьскому, хираганскому, катаканскому и тайскому письмам, и последовательности символов, не принадлежащих этим сценариям (WS).
-
Общее количество слов = (количество слов из СЯС) + (количество слов из СЯС).
-
Количество слов из WS рассчитывается как для английского языка.
-
Количество слов для СЯС — это количество символов без пробелов.
Примечание
Символы из языков CJK учитываются и как символы, и как слова.
Чтобы создать анализ, выполните следующие действия:
-
На странице
выберите одно или несколько . -
Нажмите «Проанализировать».
Откроется окно «
». -
Выберите
в раскрывающемся списке. -
При необходимости укажите имя.
-
Доступные макросы для анализа именования:
-
{jectName}
-
{sourceLang}
Добавлен язык оригинал
-
{targetLang}
Добавляет язык перевода. Если анализировать несколько языков, язык будет empty.
-
{userName}
Добавляет имя пользователя назначенного лингвиста или исполнителя. Если назначено несколько Лингвистов, имя будет empty.
-
{workflow}
-
{innerId}
-
{fileName}
Если для анализа используется больше файлов/заданий,
{fileName}
будет empty.
-
-
-
Выбрать параметры анализа. В частности:
-
Применение опции
повлияет на количество слов, так как числа не будут считаться словами. -
Опция «
» сравнивает сегменты в анализируемом задании на сходство в файле, в отличие от сравнения их только с памятью переводов (TM).Если флажок установлен
совпадения, внутренние неточные совпадения отображаются отдельной категорией во вновь созданных анализах. Например:Задание по переводу с 10 словами оригинала включает следующие сегменты, где отличается только последний символ:
-
Я купил новую машину.
-
Я купил новую машину!
В случае, если в памяти переводов (TM) не найдены совпадения, в анализе по умолчанию появятся:
Параметры IF
Категория памяти переводов (TM): 0%-49%
Категория памяти переводов (TM): 95%-99%
Категория IF: 95%-99%
Включить ЕСЛИ отключено
10 слов
Включить ЕСЛИ включен + Отдельно если отключен
5 слов
5 слов
Включить IF + Разделить IF
5 слов
5 слов
-
-
-
Нажмите «Проанализировать».
Анализ, или анализ добавляется в список.
-
Нажмите на анализ в список, чтобы отобразить его в простой таблице, или скачать для отображения в приложении по управлению проект.
Примечание
Параметры анализа можно задать при создании анализа, на уровне проекта или на глобальном уровне в настроек.
Предусмотрены три типа анализа:
Анализ по умолчанию — это стандартный анализ сегментов оригинала перед переводом. Она дает исходный анализ задания, который можно использовать вместе с анализом постредактирования, чтобы определить, сколько усилий было потрачено на перевод этого задания. Этот базовый уровень также используется в качестве основы для формирования расценок для клиентов.
Производится разбивка количества сегментов/слов/символов, и в случае использования в проекте выявляются совпадения из памяти переводов (TM) наряду с непереводимыми элементами, внутренними неточными совпадениями и Оценкой качества (QPS) (если этот параметр включен).
Анализ по умолчанию после перевода выдает неверный анализ.
Анализ постредактирования выполняется в переводе сегментах и указывает усилия на редактирование; сколько редактирования текста требуется от лингвиста или корректора. Запускается после того, как постредактирование Завершено.
Когда лингвист кликает на не переведенный сегмент, текущее наибольшее совпадение памяти переводов, предложение машинного перевода и/или непереводимое сохраняется для этого сегмента и используется при анализе постредактирования.
Анализ постредактирования может быть запущен с любого этапа рабочего процесса и рассчитывается как разница между текстом, вставленным из доступного оригинала (например, памяти переводов (TM)/машинного перевода (МТ)), и постредактированным результатом в переводе сегмента.
анализ постредактирование расширяет рамки традиционного анализ память переводов, включая машинный перевод (машинный перевод (МТ)) и непереводимые элементы (непереводимый). Поддерживаются также сторонние системы машинного перевода (МТ).
Отключение
переводов (TM) и МТ) не исключит из анализа совпадения памяти переводов (TM)/машинного перевода (МТ). В этом случае в анализе вместо усилий на постредактирование рассматривается оценка более высокого доступного совпадения.Параметры пост-анализа
Параметры постредактирование используются для расчета усилий, необходимых для постредактирование совпадений из память переводов (память переводов (TM)), непереводимых элементов (непереводимый) и машинный перевод (машинный перевод (МТ)).
Анализировать постредактирование памяти переводов (TM)
-
Предназначены для некачественных TMS, содержащих высокие процентные совпадения, требующие редактирования лингвистом.
-
Указывает усилия постредактирования памяти переводов (TM).
-
Содержит в анализе только 100% совпадения. Контекстные 101% совпадения из памяти переводов (TM) никак не влияют на расчет.
Анализ ТМ отключен
-
Предназначены для высококачественной памяти переводов (TM), в которой следует как можно меньше редактировать совпадения, чтобы снизить стоимость.
-
Указывает как на 101%, так и на 100%.
-
Указывает на совпадения памяти переводов (TM), предлагаемые лингвисту при открытии сегмента (а не на усилия постредактирования лингвиста).
-
Указывает усилия постредактирования для машинного перевода и непереводимых элементов.
Анализ непереводимого/машинного перевода (МТ)
-
Если предложение машинного перевода (МТ) или непереводимых элементов было принято без дальнейшего редактирования, то при анализе оно представляется как 100% совпадение.
-
Если лингвист изменит машинный перевод (МТ), процент совпадений будет ниже. Алгоритм подсчета оценок такой же, как при расчете оценки неточных совпадений памяти переводов.
-
Редактирование непереводимого сегмента приведет к тому, что непереводимый сегмент будет равен 0-49%.
Анализ отключенного постредактирования NT/MT
-
Записи из машинного перевода (МТ)/непереводимых без какой-либо предполагаемой оценки будут считаться совпадениями памяти переводов (TM) 0%-49%. Они будут указаны как переведенные лингвистом, при этом машинный перевод (МТ) не будет рассмотрен.
-
Оценка качества (QPS) и совпадений Phrase Language AI выше 75% будет проводиться в столбце машинного перевода (МТ) в соответствующих совпадениях.
-
Указывает на совпадения непереводимых элементов и машинного перевода (МТ), предлагаемые лингвисту при открытии сегмента (а не на реальные усилия лингвиста на постредактирование).
Автоматически генерировать анализ постредактирования перед обновлением оригинала
-
Создается анализ:
-
За каждое обновленное задание.
-
для каждого отдельного поставщика в отдельности и назначенного этому соответствующему поставщику.
-
-
Анализ не создается, если:
-
Лингвист или исполнитель не назначен.
-
-
Количество анализов подтверждено и переведено сегментов.
-
Анализ проводится в соответствии с условностью наименования:
-
UpdateSource #{innerID}{workflow}
-
-
Будет создан анализ с выбором единиц подсчета (оригинала), Анализ непереводимого постредактирования, Анализ памяти переводов (TM) и Анализ постредактирования машинного перевода (МТ).
Единицы подсчета
-
Выберите, какое количество слов будет представлено в анализе. Количество слов в переводе может быть больше, чем количество слов в оригинале.
Не влияет на оценку совпадений.
-
планов: Team, Ultimate и Enterprise (устаревшая версия)
Свяжитесь с отделом продаж по вопросам лицензирования.
Функция Сравнить анализ доступна только в проектах с этапами рабочего процесса. Здесь сравниваются две версии файла на разных этапах Рабочего процесса на уровне сегмента и анализируется, чем отличаются две версии. Если для анализа нет настроек конкретного проекта, используются настройки по умолчанию, которые могут привести к созданию неверных отчетов.
Пример
Анализ можно провести по нескольким заданиям и сгруппировать двумя способами:
-
Анализ по поставщику
-
Для проекта с большим количеством заданий, назначенных различным Лингвистам или Исполнителям. Раньше:
-
Создайте отдельный анализ, содержащий файлы, назначенные отдельным Лингвистам или Исполнителям.
-
Назначить поставщика для проведения анализа поставщика, который сделает его видимым для своих лингвистов/Исполнителей.
Схема расчета чистых ставок будет предварительно выбрана в качестве опции, если она применяется к поставщику.
-
-
-
Анализ по языкам
-
Если проект содержит несколько языков перевода, анализ всех файлов можно проводить пакетом, создавая отдельный анализ для каждого отдельного языка.
Чтобы проанализировать по языкам, выполните следующие действия:
-
На странице проекта выберите все файлы
. -
Нажмите «Проанализировать».
Откроется окно «
». -
Сохраните настройки по умолчанию и выберите
. -
Нажмите «Проанализировать».
Анализ задания составляется по языкам.
Примечание
Снимите этот параметр, чтобы создать единый анализ для многоязычного проекта.
-
-
Если файл оригинала, используемый для анализа, обновляется, то в таблице анализа он указывается как устаревший .
При пересчете применяются настройки, использованные для исходного анализа.
Исполнителям не разрешается пересчитывать анализы, созданные Покупателями.
Для пересчета с использованием нового оригинала файла выполните следующие действия:
Настроить вид анализа
В таблице анализа можно отобразить/скрыть
, , , и . Столбец также доступен для анализа постредактирования и показывает, сколько секунд было потрачено на редактирование сегмента.Скачать анализ
Чтобы скачать анализ, выполните следующие действия:
-
Нажмите Скачать, чтобы представить раскрывающееся меню и выберите:
-
CSV (разделенные запятыми значения) с символами или без символов и для чтения в приложениях электронной таблицы.
-
LOG (аналог формата SDL Trados) и читабельный для большинства приложений для управления проектами.
-
JSON (JavaScript Object Notation), облегченный формат обмена данными.
Только анализ, загруженный в формате JSON, будет включать разбивку данных непереводимых, машинных переводов (МТ), памяти переводов (TM) и внутренних нечетких (IF) элементов по типу совпадения.
-
-
Выбор типа файла запускает скачать.
Эти файлы можно импортировать в большинство программных систем управления проектами.
Применить схему расчета чистой ставки
При анализе можно применить скидку к словам/символам/страницам. Объем перевода со скидкой тут же рассчитывается и отображается непосредственно в анализе в строке «
.Чтобы удалить схему расчета чистой ставки из анализа, оставьте поле След. кнопке
empty.При применении к анализу схемы расчета чистых ставок скачанный файл с анализом показывает взвешенное количество слов в каждой категории совпадений.
Чтобы назначить анализ поставщику, выполните следующие действия:
-
Выберите анализ из списка и нажмите «Редактировать».
Открывается страница редактирования.
-
Выберите поставщика в раскрывающемся списке.
-
Нажмите «Сохранить».
Анализ будет доступен назначенному поставщику на портале лингвистов Portal.