Базы терминов (TMS)

Modify or Import to Term Bases (TMS)

Контент автоматически переведен с английского языка с помощью Phrase Language AI.

Массовый импорт и модификация контента базы терминов помогают управлять и поддерживать терминологию в больших масштабах, снижая ручные усилия. Эти функции поддерживают:

  • Обновления терминологии в большом масштабе, включающие несколько терминов или атрибутов

  • Сотрудничество между инструментами и командами

  • Миграция терминологии из других систем

  • Единообразное использование терминов в проектах и рабочих процессах

Внешние файлы терминологии (или глоссарии) могут быть импортированы в форматах Excel (.XLSX) или .TBX. Ограничение по размеру файла, который можно загрузить, составляет 1 ГБ. Экспортированная база терминов содержит все языки данной базы терминов.

Если база терминов требует массовых изменений, таких как массовое удаление или обновление многих терминов, их можно экспортировать и массово изменить в внешних таблицах.

Чтобы импортировать контент, выполните следующие шаги:

  1. На странице базы терминов нажмите Импорт в меню Действия в верхней части страницы.

    Окно Импорт базы терминов открывается.

  2. Выберите файл для импорта:

    • XLSX

      Файл формата XML для таблиц (Excel).

      Файл должен быть подготовлен определенным образом для импорта.

      .XLSX - это самый простой способ импортировать термины в базу терминов. Можно импортировать простой список терминов, но также поддерживаются более сложные импорты терминологии (импорт синонимов, морфологии, терминов с различными атрибутами и т. д.).

    • TBX

      Формат обмена для использования в других CAT-инструментах. Он также может использоваться для редактирования контента во внешних инструментах, таких как Okapi Olifant.

  3. Выберите параметры:

    • Создать новые термины

    • Обновить существующие термины

    • Строгое соответствие языковому стандарту

      Предотвращает импорт языка, если он имеет другой языковой стандарт, чем проект.

      Пример:

      Файл с обозначением EN_US не будет импортирован в память переводов, обозначенную только EN и не EN_US.

Метаданные термина в базе терминов

Каждый термин в базе терминов имеет список атрибутов, которые могут быть экспортированы или импортированы из файлов .TBX или .XLSX. Некоторые из этих атрибутов могут быть отредактированы непосредственно в настройках термина или отредактированы внешне в файле .XLSX или .TBX.

Атрибуты базы терминов (Клиент, Отрасль и т. д.) не влияют на отдельные атрибуты термина.

.XLSX файлы

Метаданные термина, такие как запрещенный, предпочтительный, регистр или точный, хранятся как логические (TRUE/FALSE) значения в Excel. В зависимости от настроек языкового стандарта Windows, вы можете найти эти значения на вашем языке в экспорте .XLSX (например, WAHR/FALSCH для немецкого). При редактировании базы терминов в Excel следуйте шаблону и вводите эти значения на требуемом языке, чтобы Excel мог их распознать и поддерживать целостность файла. Для других столбцов используйте английские значения, как указано ниже.

  • CID

    Идентификатор концепции фразы. Концепция термина включает источник и все его цели и синонимы.

  • concept_domain

  • concept_subdomain

  • concept_url

  • concept_definition

  • concept_note

  • TID

    Идентификатор термина фразы. Идентификатор конкретного термина на конкретном языке.

  • {языковый код}

    Языковой код термина на основе поддерживаемых языков.

  • статус

    Либо Новый, либо Утверждено.

  • запрещенный

    Истина или Ложь.

  • предпочтительный

    Истина или Ложь.

  • случай

    Значение чувствительный к регистру. Случай может быть либо Истина, либо Ложь.

  • точный

    Значение точное совпадение. Это может быть либо Истина, либо Ложь (для неточного совпадения).

  • примечание

    Только целевое примечание будет отображаться в редакторе.

  • использование

    Только целевое использование будет отображаться в редакторе.

  • ЧАСТЬ РЕЧИ

    Часть речи; значения могут быть Прилагательное, Существительное, Глагол или Наречие.

  • род

    Значения могут быть Мужской, Женский или Нейтральный.

  • число

    Значения могут быть единственными, множественными или неисчисляемыми.

  • short_translation

  • term_type

    Значения могут быть Полная_форма, Краткая_форма, Акроним, Сокращение, Фраза или Вариант.

  • created_by

    Поддерживаются только имена пользователей Фраз.

  • created_at

    Дата и время создания термина

  • изменено_кем

    Поддерживаются только имена пользователей Фраз.

  • modified_at

    Дата и время последнего изменения термина

.TBX Файлы

  • <descrip type="conceptId">

    Идентификатор концепции Фразы (необходим для повторного импорта обновленных терминов). Концепция термина включает источник и все его цели и синонимы.

  • <descrip type="conceptDefinition">

  • <descrip type="conceptDomain">

  • <descrip type="conceptNote">

  • <descrip type="conceptSubdomain">

  • <descrip type="conceptUrl">

  • <langSet xml:lang="cs">

    Языковой код термина на основе поддерживаемых языков.

  • <termNote type="termId">

    Идентификатор термина (необходим для повторного импорта обновленных терминов). Это идентификатор конкретного термина на конкретном языке.

  • <note>

    Заметка термина

  • <termNote type="partOfSpeech">

  • <termNote type="grammaticalGender">

  • <termNote type="grammaticalNumber">

  • <termNote type="usageNote">

  • <termNote type="forbidden">

    Истина или Ложь

  • <termNote type="preferred">

    Истина или Ложь

  • <termNote type="exactMatch">

    Истина или Ложь

  • <termNote type="status">

    Новый или Утверждено

  • <termNote type="caseSensitive">

    Истина или Ложь

  • <termNote type="createdBy">

    Имя пользователя

  • <termNote type="createdAt">

    Unix время

  • <termNote type="lastModifiedBy">

    Имя пользователя

  • <termNote type="lastModifiedAt">

    Unix время

  • <termNote type="shortTranslation">

  • <termNote type="termType">

Подготовьте .XLSX (Excel) для импорта в базу терминов

.XLSX файлы должны быть отформатированы определенным образом перед импортом.

При импорте файлов, содержащих значения даты или времени, убедитесь, что ячейки отформатированы как действительные значения даты/времени Excel, а не как простой текст.

Чтобы подготовить файл, выполните следующие шаги:

  1. В файле .XLSX организуйте все термины в столбцы, каждый столбец представляет один язык.

  2. В первой строке примените языковой код для каждого языка.

    Пример:

    A

    B

    C

    1

    en

    de_de

    it

    2

    Соглашение

    Соглашение

    соглашение

    3

    Совместный комитет

    Смешанная комиссия

    Совместная комиссия

    4

    Федеральный совет

    Бундесрат

    Федеральный совет

  3. Сохраните файл.

Синонимы

Синонимы могут быть добавлены путем добавления второго столбца с тем же языковым кодом.

Пример:

en

en

de _de

Соглашение

Контракт

Соглашение

Совместный комитет

Смешанная комиссия

Термины с атрибутами

Термины могут быть импортированы с указанными атрибутами. Некоторые из них генерируются Phrase и доступны только в файлах, экспортированных из базы терминов Phrase.

Чтобы применить атрибут к термину, выполните следующие шаги:

  1. Поместите столбец с именем атрибута после каждого термина или столбца с синонимами.

  2. Поместите значение атрибута в строку с соответствующим термином.

Термины со сложной морфологией

Термины, которые импортируются, следуют тем же правилам морфологии, что и термины, созданные непосредственно в базе терминов.

Помимо работы с синонимами и неточными/точными совпадениями, символ вертикальной черты может быть добавлен в качестве границы между корнем слова (часть, которая не меняется) и суффиксом (часть, которая меняется).

Пример:

Термин smíšen|ý на чешском языке также может встречаться как smíšeného, smíšenou и т.д. Помещение символа | перед ý гарантирует, что все три окончания будут считаться совпадениями.

.TBX Импортный формат

Формат .TBX поддерживается для импорта (и экспорта) терминологии. Стандарт .TBX считается свободным стандартом. Если файл .TBX импортируется из другого CAT инструмента, некоторые метаданные могут не быть импортированы.

При импорте терминологии между двумя базами терминов используйте формат .TBX. В среде Phrase данные будут правильно импортированы.

SDL Trados использует специальный формат TBX.XML и имеет разные спецификации для импорта.

Multiterm .TBX

Процесс импорта из файлов Multiterm .TBX был оптимизирован, и следующие метаданные будут импортированы:

  • Временные метки (создано, последнее изменение)

  • Значение в элементе <descrip type="usageNote"> к атрибуту использование всех терминов концепции

  • Значение в элементе <descrip type="note"> к атрибуту заметка всех терминов концепции

Импорт TBX.xml из SDL Trados

SDL Trados не поддерживает формат .TBX для баз терминов и использует формат .XML с схемой TBX. Импорт этого формата .XML поддерживается, но не со всеми атрибутами.

Атрибуты, указанные для всей концепции термина, будут добавлены к каждому отдельному термину Заметка (каждый язык, каждый синоним и т.д.)

Импортированные атрибуты:

  • Оригинал

  • Перевод

  • Синонимы

  • Дата создания

  • Дата изменения

  • Имена автора и рецензента

    Эти данные будут импортированы только в том случае, если имя совпадает с именем пользователя существующего пользователя Phrase. Либо отредактируйте имена в TBX.xml, либо добавьте пользователей в Phrase.

  • Настраиваемые атрибуты

    Эти данные будут импортированы в примечание термина. Каждый атрибут будет иметь отдельную строку, начинающуюся с имени атрибута. Например:

    • Происхождение: Википедия

    • Тема: Право

    • Статус: Новые

Отредактируйте TBX.xml перед импортом

Чтобы наилучшим образом использовать ваши данные, отредактируйте файл TBX.xml перед его импортом. Чтобы отредактировать файл, откройте его в текстовом редакторе, который поддерживает многострочные регулярные выражения (например, Notepad++) и который может использовать регулярные выражения в функциях Поиск и замена.

Редактирование примечания, использования и статуса

Настраиваемые атрибуты в файлах TBX.xml имеют следующий формат. Фактические названия атрибутов будут различаться, так как они не стандартизированы:

<descripGrp>
<descrip type="Comment">термин =API= не должен переводиться</descrip>
</descripGrp>
<descripGrp>
<descrip type="Definition">API = интерфейс программирования приложений</descrip>
</descripGrp>
<descripGrp>
<descrip type="Example">Phrase предлагает набор вызовов API.</descrip>
</descripGrp>
<descripGrp>
<descrip type="Status">подтверждено</descrip>
</descripGrp>

Эти атрибуты будут автоматически импортированы в Примечание:

  • Комментарий: термин =API= не должен переводиться

  • Определение: API = интерфейс программирования приложений

  • Например: Фраза предлагает набор вызовов API

  • Статус: подтверждено

Чтобы изменить это поведение и импортировать, например:

  • Только Комментарий как Примечание

  • Пример как Использование

  • Статус как Утверждено или Новый

  • Не требуется импорт Определение

Отредактируйте файл TBX.xml, чтобы соответствовать стандарту формата Фразы для .TBX файлов:

<note>термин =API= не должен переводиться</note>
<termNote type="usageNote">Фраза предлагает набор вызовов API.</termNote>
<termNote type="status">Утверждено</termNote>

Изменение Комментарий на Примечание

Поиск:

<descripGrp>.[^\<]+<descrip type="Comment">([^\<]+)</descrip>.[^\<]+</descripGrp>

Заменить:

<note>\1</note>

Изменение Пример на Использование

Поиск:

<descripGrp>.[^\<]+<descrip type="Example">([^\<]+)</descrip>.[^\<]+</descripGrp>

Заменить:

<termNote type="usageNote">\1</termNote>
Установка Статус на Утверждено

Поиск:

<descripGrp>.[^\<]+<descrip type="Status">[^\<]+</descrip>.[^\<]+</descripGrp>

Заменить:

<termNote type="status">Утверждено</termNote>

Удаление Определение

<descripGrp>.[^\<]+<descrip type="Definition">([^\<]+)</descrip>.[^\<]+</descripGrp>

Заменить на пустое поле.

Добавление автора к заметке

Удалите автора из элемента <transacGrp / origination> и добавьте его в элемент <descript>.

<transacGrp>
<transac type="terminologyManagementTransactions">origination</transac>
<date>2006-09-27T11:25:19</date>
<transacNote type="responsibility">MikeS</transacNote>
</transacGrp>

должен быть заменен на:

<transacGrp>
<transac type="terminologyManagementTransactions">origination</transac>
<date>2006-09-27T11:25:19</date>
</transacGrp>
<descripGrp>
<descrip type="author">MikeS</descrip>
</descripGrp>

Регулярное выражение будет:

Поиск:

(origination</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>

Заменить:

\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>

Добавление редактирования к заметке

Чтобы добавить Редактировано к Заметке, удалите редактора из элемента <transacGrp / modification> и добавьте его в элемент <descript>.

<transacGrp>
<transac type="terminologyManagementTransactions">modification</transac>
<date>2006-09-27T11:25:19</date>
<transacNote type="responsibility">lauraB</transacNote>
</transacGrp>

должен быть заменен на:

<transacGrp>
<transac type="terminologyManagementTransactions">modification</transac>
<date>2006-09-27T11:25:19</date>
</transacGrp>
<descripGrp>
<descrip type="Отредактировано">lauraB</descrip>
</descripGrp>

Регулярное выражение будет:

Поиск:

(изменение</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="ответственность">([^\<]+)</transacNote>.[^\<]+</transacGrp>

Заменить:

\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="отредактировано">\2</descrip>\r\n</descripGrp>

Массовые удаления или обновления терминов

Если администратор предоставил права, термины могут быть экспортированы в файл .XLSX для модификации перед повторным импортом. Это можно использовать для массовых изменений или удалений. Терминальные базы могут быть экспортированы только по одному.

Следующая процедура требует, чтобы файл .XLSX был импортирован в ту же терминальную базу, из которой он был экспортирован. Если импортирован в другую терминальную базу, термины будут дублироваться вместо обновления, и термины, помеченные для удаления, не будут удалены.

Рекомендуется сделать вторичный экспорт в формате .TBX в качестве резервной копии на случай, если модифицированный импорт был неправильным.

Чтобы модифицировать термины внешне, выполните следующие шаги:

  1. На странице терминальной базы нажмите Экспорт в меню Действия More Menu в верхней части страницы.

    Открывается окно Экспорт терминальной базы.

  2. Выберите экспорт в формате XLSX.

  3. Выберите атрибуты концепции и термина для экспорта в выпадающих меню Поля концепции и Поля термина.

    Атрибуты, определенные системой, отображаются с иконкой замка System-defined attribute.

    Примечание

    При экспорте терминальной базы включаются только системные атрибуты. Экспорт пользовательских полей не поддерживается.

  4. Нажмите Экспорт.

    Файл .XLSX создан и загружен в систему.

  5. Измените файл .XLSX с необходимыми изменениями, не удаляя информацию CID или TID.

    Метаданные (дата создания, дата изменения и т. д.) могут быть использованы для фильтрации терминов в приложении для работы с таблицами, чтобы отобразить только определенную группу.

    • Обновление

      Чтобы обновить термин, перепишите существующий термин в столбце для данного языка.

      В отличие от памяти переводов, суффикс |обновить не требуется, но будет работать правильно, если добавлен к CID или TID.

      Новые термины могут быть добавлены в столбец для данного языка в виде дополнительных строк и будут импортированы как новые в существующую базу терминов.

    • Выполняется удаление

      Термины могут быть удалены следующим образом:

      • Добавление |удалить в качестве суффикса к CID термина для удаления термина из всех языков.

      • Добавление |удалить в качестве суффикса к TID термина для удаления термина из конкретного языка.

      Пример терминов, которые устанавливаются для удаления на всех языках (столбец CID) и на конкретном языке (столбец TID):

      modify-term_excel.png
  6. Сохраните файл .XLSX и импортируйте его обратно с опцией Обновить существующие термины.

Была ли эта статья полезной?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.