Внешние файлы терминологии (или глоссария) можно импортировать в форматах файлов Excel (.XLSX) или .TBX. Ограничение по размеру файла, который можно загрузить, составляет 1 Гб. Экспортируемая база терминов содержит все языки данной базы терминов.
Если база терминов требует массовых изменений, таких как массовое удаление или обновление многих терминов, их можно экспортировать и массово изменить во внешних приложениях электронной таблицы.
Чтобы импортировать контент, выполните следующие действия:
-
На странице базы терминов нажмите «Импортировать».
Откроется окно Импортировать TBX/XLSX.
-
Выберите файл для импортировать:
-
Формат файла на основе XML для приложений электронной таблицы (Excel).
Файл должен быть подготовлен специальным образом, чтобы импортироваться.
.XLSX — самый простой способ импортировать термины в базу терминов. Можно импортировать простой список терминов, но поддерживается и более сложный импорт терминологии (импорт синонимов, морфологии, терминов с различными атрибутами и т. д.).
-
TBX
Формат обмена, используемый в других Инструментах автоматизированного перевода. Также можно использовать для редактирования контента во внешних Инструментах, таких как Okapi Olifant.
-
-
Выбрать варианты:
-
-
-
Не позволяет импортировать язык, если у него другой языковой стандарт, чем у проекта.
Пример:
Файл с обозначением EN_ US не будет импортирован в память переводов (TM), обозначенную только EN, а не EN_ US.
-
Каждый термин в базе терминов имеет список атрибутов, которые можно экспортировать в файлы .TBX или .XLSX или импортировать из них. Некоторые из этих атрибутов можно редактировать непосредственно в настройках термина или редактировать извне в файле .XLSX или .TBX.
Атрибуты базы терминов (Клиент, отрасль и т. д.) никак не влияют на индивидуальные атрибуты термина.
Файлы .XLSX
Метаданные терминов, такие как запрещенные, предпочтительные, регистровые или точные, сохраняются в Excel в виде логических значений (TRUE/FALSE). Исходя из ваших настроек языковых стандартов Windows, вы можете найти эти значения на своем языке в экспортируемом .XLSX (например, WAHR/FALSCH для немецкого языка). Редактируя базу терминов в Excel, следуйте шаблону и введите эти значения на необходимом языке, чтобы Excel распознал их и сохранил целостность файла. Для других столбцов используйте английские значения, как указано ниже.
-
CID
Идентификатор phrase Concept. Понятие термина включает оригинал и все его цели и синонимы.
-
concept_domain
-
concept_subdomain
-
concept_url
-
concept_definition
-
concept_note
-
TID
Идентификатор термина phrase. Идентификатор конкретного термина на определенном языке.
-
{Language code}
Языковой код термина на основе поддерживаемых языков.
-
статус
Либо Новый, либо Утвержденный.
-
запрещено
Правда или ложь.
-
Предпочтительно
Правда или ложь.
-
дело
То есть с учетом регистра. Случай может быть как Правдивым, так и Ложным.
-
точный
То есть точное совпадение. Это может быть как Правда, так и Ложь (для неточного совпадения).
-
примечание
В редакторе будет отображаться только примечание к переводу.
-
использование
В редакторе будет отображаться только использование перевода.
-
POS
Часть Речи; значения могут быть Прилагательное, Существительное, Глагол или Наречие.
-
пол
Ценности могут быть мужскими, женскими или Нейтральными.
-
число
Значения могут быть Единственным, Множественным и Несчетным.
-
short_translation
-
term_type
Значения могут быть Full_form, Short_form, Acronym, Abbreviation, phrase или Variant.
-
created_by
Поддерживаются только имена пользователей phrase
-
created_at
Дата и время создания термина
-
modified_by
Поддерживаются только имена пользователей phrase
-
modified_at
Дата и время последней модификации термина
.TBX файлы
-
<descrip type="conceptId">
Phrase Concept Идентификатор (нужен для повторного импорта обновленных терминов). Понятие термина включает оригинал и все его цели и синонимы.
-
<descrip type="conceptDefinition">
-
<descrip type="conceptDomain">
-
<descrip type="conceptNote">
-
<descrip type="conceptSubdomain">
-
<descrip type="conceptUrl">
-
<langSet xml:lang="cs">
Языковой код термина на основе поддерживаемых языков.
-
<termNote type="termId">
Идентификатор термина phrase (нужен для повторного импорта обновленных терминов). Это Идентификатор конкретного термина в определенном языке.
-
<note>
Примечание термина
-
<termNote type="partOfSpeech">
-
<termNote type="grammaticalGender">
-
<termNote type="grammaticalNumber">
-
<termNote type="usageNote">
-
<termNote type="forbidden">
Правда или ложь
-
<termNote type="preferred">
Правда или ложь
-
<termNote type="exactMatch">
Правда или ложь
-
<termNote type="status">
Новый или Утвержденный
-
<termNote type="caseSensitive">
Правда или ложь
-
<termNote type="createdBy">
Имя пользователя phrase
-
<termNote type="createdAt">
Время Unix
-
<termNote type="lastModifiedBy">
Имя пользователя phrase
-
<termNote type="lastModifiedAt">
Время Unix
-
<termNote type="shortTranslation">
-
<termNote type="termType">
Перед импортом файлы .XLSX должны быть отформатированы особым образом.
Чтобы подготовить файл, выполните следующие действия:
-
В файле .XLSX организуйте все термины в столбцы, каждый столбец которых представляет один язык.
-
В первой строке примените языковой код для каждого языка.
Пример:
-
Сохраните файл.
Синонимы
Синонимы можно разместить, добавив второй столбец с тем же языковым кодом.
Пример:
Термины с атрибутами
Термины можно импортировать с заданными атрибутами. Некоторые из них генерируются Phrase и доступны только в файлах, экспортируемых из базы терминов (TB) Phrase.
Чтобы применить атрибут к термину, выполните следующие действия:
-
Поместите столбец с именем атрибута после каждого столбца термина или синонима.
-
Поместите значение атрибута в строку с связанным термином.
Термины со сложной морфологией
Импортируемые термины соответствуют тем же правилам морфологии, что и термины, созданные непосредственно в базе терминов.
Помимо работы с синонимами и Неточными/Точными совпадениями, символ трубы можно добавить как границу между словом стебель (часть, которая не изменит) и суффиксом (часть, которая изменит).
Пример:
Формат .TBX поддерживается для импорта (и экспорта) терминологии. Стандарт .TBX считается свободным стандартом. Если файл .TBX импортируется из другого CAT-инструмента, некоторые метаданные могут не импортироваться.
При импорте терминологии между двумя терминологическими базами используйте формат .TBX. Внутри среды phrase данные будут корректно импортированы.
SDL Trados использует специальный формат TBX.XML, который импортируется с различными спецификациями.
Multiterm .TBX
Оптимизирован процесс импорта из файлов Multiterm .TBX, будут импортированы следующие метаданные:
-
Временные метки (созданы в, последнее изменение внесено в)
-
Значение в элементе
<descrip type="usageNote">
для использования атрибутов всех терминов понятия -
Значение в элементе
<descrip type="note">
к примечанию к атрибуту всех терминов понятия
SDL Trados не поддерживает формат .TBX для баз терминов и использует формат .XML со схемой TBX. Импорт этого формата .XML поддерживается, но не со всеми атрибутами.
Атрибуты, указанные для всей концепции термина, будут добавлены в Примечание каждого отдельного термина (каждый язык, каждый синоним и т. д.)
Импортированные атрибуты:
-
Источник
-
Перевод
-
Синонимы
-
Дата создания
-
Дата изменения
-
Имена автора и редактора
Они будут импортированы только в том случае, если имя совпадает с именем пользователя существующего пользователя phrase. Либо отредактируйте имена в TBX. xml, либо добавьте пользователей в phrase.
-
Настраиваемые атрибуты
Они будут импортированы в примечание к термину. Каждый атрибут будет иметь отдельную строку, начинающуюся с имени атрибута. Например:
-
Происхождение: Википедия
-
Тема: Закон
-
Статус: Новая
-
Отредактируйте TBX.xml перед тем как импортировать
Чтобы оптимально использовать данные, отредактируйте файл TBX.xml перед его импортом. Чтобы отредактировать файл, откройте его в текстовом редакторе, который поддерживает многострочные регулярные выражения (например, Notepad++) и может использовать стандартные выражения в функциях «Поиск и Заменить».
Примечание, употребление и статус редактирования
Настраиваемые атрибуты в файлах TBX.xml имеют следующий формат. Фактические названия атрибутов будут отличаться, поскольку они не стандартизированы:
<descripGrp> <descrip type="Комментарий">термин =интерфейс приложений API= не следует переводить</descrip> </descripGrp> <descripGrp> <descrip type="Определение">Интерфейс приложений API = интерфейс программирования приложений</descrip> </descripGrp> <descripGrp> <descrip type="Пример">phrase предлагает набор вызовов интерфейс приложений API.</descrip> </descripGrp> <descripGrp> <descrip type="Статус">подтверждено</descrip> </descripGrp>
В Примечание будут автоматически импортированы следующие атрибуты:
-
Комментарий: термин =интерфейс приложений API= не следует переводить
-
Определение: Интерфейс приложений API = интерфейс прикладного программирования
-
Например: phrase предлагает набор вызовов интерфейса приложений API
-
Статус: подтверждено
Чтобы изменить это поведение и импортировать, например:
-
Только Комментарий как примечание
-
Пример использования
-
Статус как Утвержденный или новый
-
Не требуется импортировать определение
Редактировать файл TBX.xml в соответствии со стандартом формата Phrase для файлов .TBX:
<note>термин =интерфейс приложений API= не следует переводить</note> <termNote type="usageNote">phrase предлагает набор вызовов интерфейс приложений API.</termNote> <termNote type="статус">Утвержден</termNote>
Изменение Комментария к примечанию
Поиск:
<descripGrp>.[^\<]+<descrip type="комментировать">([^\<]+)</descrip>.[^\<]+</descripGrp>
Заменить:
<note>\1</note>
Изменение примера на использование
Поиск:
<descripGrp>.[^\<]+<descrip type="Пример">([^\<]+)</descrip>.[^\<]+</descripGrp>
Заменить:
<termNote type="usageNote">\1</termNote>
Присвоение статуса «Одобрено»
Поиск:
<descripGrp>.[^\<]+<descrip type="Status">[^\<]+</descrip>.[^\<]+</descripGrp>
Заменить:
<termNote type="статус">Утвержден</termNote>
Удаление определения
<descripGrp>.[^\<]+<descrip type="Определение">([^\<]+)</descrip>.[^\<]+</descripGrp>
Заменить на empty field.
Добавить автора в примечание
Удалите автора из элемента <transacGrp / origination>
и добавьте его в элемент <descript>
.
<transacGrp> <transac type="terminologyManagementTransactions">происхождение</transac> <date>2006-09-27T11:25:19</date> <transacNote type="ответственность">MikeS</transacNote> </transacGrp>
следует заменить на:
<transacGrp> <transac type="terminologyManagementTransactions">происхождение</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="автор">MikeS</descrip> </descripGrp>
Регулярное выражение будет иметь вид:
Поиск:
(происхождение</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
Заменить:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>
Добавление отредактированных в примечание
Чтобы добавить Отредактировано в Примечание, удалите редактор из элемента <transacGrp / изменение{
и добавьте его в элемент <описания>
.
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> <transacNote type="ответственность">lauraB</transacNote> </transacGrp>
следует заменить на:
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="Отредактировано">lauraB</descrip> </descripGrp>
Регулярное выражение будет иметь вид:
Поиск:
(изменение</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="ответственность">([^\<]+)</transacNote>.[^\<]+</transacGrp>
Заменить:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="отредактировано">\2</descrip>\r\n</descripGrp>
Если администратор предоставил права, термины можно экспортировать в файл .XLSX для изменения перед их импортом обратно. Это можно использовать для массовых изменений или удалений. Базы терминов можно экспортировать только одну за другой.
Следующая процедура требует, чтобы файл .XLSX был импортирован в ту же базу терминов, из которой он был экспортирован. При импорте в другую базу терминов термины будут дублироваться вместо обновления, а термины, помеченные для удаления, не удаляться.
Рекомендуется вторично экспортировать в формате .TBX в качестве резервного варианта в случае, если было неправильно импортировано изменение.
Для внешнего изменения терминов выполните следующие действия:
-
На странице базы терминов нажмите «Экспортировать».
Откроется окно «
». -
Выберите XLSX в качестве .
-
Выберите атрибуты термина для экспортируемого.
-
Нажмите Экспортировать.
Файл .XLSX создан и загружен в систему.
-
Измените файл .XLSX с необходимыми изменениями без удаления информации об идентификаторе или TID.
Метаданные (дата создания, дата изменения и т. д.) можно использовать, чтобы фильтровать термины в приложении электронной таблицы только для отображения определенной группы.
-
Обновление
Чтобы обновить термин, перепишите существующий термин в столбце для данного языка.
В отличие от памяти переводов, суффикс
|обновить
не требуется, но он будет работать корректно при добавлении в CID или TID.В столбец для данного языка можно добавить новые термины в виде дополнительных строк, которые будут импортированы в качестве новых в существующую базу терминов.
-
Выполняется удаление
Термины могут быть удалены:
-
|Удалить как суффикс в CID термина, чтобы удалить термин со всех языков.
-
|Удалить как суффикс в TID термина, чтобы удалить термин с определенного языка.
Пример терминов, задаваемых для удаления на всех языках (столбец CID) и определенном языке (столбец TID):
-
-
-
Сохраните файл .XLSX и импортируйте его обратно с помощью опции Обновить существующие термины.