用語ベースのコンテンツを一括インポートおよび変更することで、手動作業を減らしながら、大規模に用語を管理および維持できます。これらの機能はサポートします:
-
複数の用語や属性を含む大規模な用語更新
-
ツールやチーム間のコラボレーション
-
他のシステムからの用語の移行
-
プロジェクトやワークフロー全体での一貫した用語の使用
外部の用語(または用語集)ファイルは、Excel(.XLSX)または.TBXファイル形式でインポートできます。アップロードできるファイルのサイズ制限は1GBです。エクスポートされた用語ベースには、指定された用語ベースのすべての言語が含まれます。
用語ベースに一括変更が必要な場合(大量削除や多くの用語の更新など)、それらは外部のスプレッドシートアプリケーションでエクスポートして一括変更できます。
コンテンツをインポートするには、次の手順に従います:
-
用語ベースページから、ページの上部にある
メニューのインポートをクリックします。
ウィンドウが開きます。
-
インポートするファイルを選択してください:
-
スプレッドシートアプリケーション(Excel)用のXMLベースのファイル形式。
ファイルは、インポートのために特定の方法で準備する必要があります。
.XLSXは、用語を用語ベースにインポートする最も簡単な方法です。用語の単純なリストをインポートできますが、より複雑な用語のインポートもサポートされています(同義語、形態、さまざまな属性を持つ用語のインポートなど)。
-
TBX
他のCATツールで使用するための交換形式です。Okapi Olifantのような外部ツールでコンテンツを編集するためにも使用できます。
-
-
オプションを選択:
-
-
-
プロジェクトと異なるロケールを持つ言語のインポートを防ぎます。
例::
EN_USの指定を持つファイルは、ENのみが指定されたTMにはインポートされず、EN_USにはインポートされません。
-
用語ベース内の各用語には、.TBXまたは.XLSXファイルにエクスポートまたはインポートできる属性の一覧があります。これらの属性の一部は、用語設定で直接編集するか、.XLSXまたは.TBXファイルで外部的に編集できます。
用語ベースの属性(クライアント、ドメインなど)は、個々の用語属性には影響を与えません。
.XLSXファイル
禁止、優先、ケース、または正確などの用語メタデータは、Excel内でブール値(TRUE/FALSE)として保存されます。Windowsのロケール設定に基づいて、.XLSXエクスポート内でこれらの値をあなたの言語で見つけることができます(例:ドイツ語のWAHR/FALSCH)。Excelで用語ベースを編集する際は、パターンに従い、Excelがそれらを認識し、ファイルの整合性を維持できるように必要な言語でこれらの値を入力してください。他の列については、以下に記載されているように英語の値を使用してください。
-
CID
フレーズコンセプトID。用語の概念には、原文とそのすべての訳文および同義語が含まれます。
-
concept_domain
-
concept_subdomain
-
concept_url
-
concept_definition
-
concept_note
-
TID
フレーズ用語ID。特定の言語における特定の用語のID。
-
{言語コード}
用語の言語コードはサポートされている言語に基づきます。
-
status
新規または承認済みのいずれか。
-
forbidden
真または偽。
-
preferred
真または偽。
-
case
意味はケースセンシティブです。ケースは真または偽のいずれかです。
-
exact
意味は完全一致です。これは真または偽のいずれかです(あいまい一致の場合)。
-
note
エディタにはターゲットの備考のみが表示されます。
-
usage
エディタにはターゲットの使用のみが表示されます。
-
POS
品詞; 値は形容詞、名詞、動詞、または副詞です。
-
性別
値は男性、女性、またはニュートラルです。
-
number
値は単数、複数、または不可算です。
-
short_translation
-
term_type
値はフルフォーム、ショートフォーム、頭字語、略語、フレーズ、またはバリアントです。
-
created_by
フレーズのユーザー名のみがサポートされています。
-
created_at
用語作成の日付と時刻
-
modified_by
フレーズのユーザー名のみがサポートされています。
-
modified_at
用語の最終修正の日付と時刻
.TBXファイル
-
<descrip type="conceptId">
フレーズコンセプトID(更新された用語を再インポートするために必要)。用語の概念には、ソースとそのすべてのターゲットおよび同義語が含まれます。
-
<descrip type="conceptDefinition">
-
<descrip type="conceptDomain">
-
<descrip type="conceptNote">
-
<descrip type="conceptSubdomain">
-
<descrip type="conceptUrl">
-
<langSet xml:lang="cs">
サポートされている言語に基づく用語の言語コード。
-
<termNote type="termId">
フレーズ用語ID(更新された用語を再インポートするために必要)。これは特定の言語における特定の用語のIDです。
-
<note>
用語のノート
-
<termNote type="partOfSpeech">
-
<termNote type="grammaticalGender">
-
<termNote type="grammaticalNumber">
-
<termNote type="usageNote">
-
<termNote type="forbidden">
真か偽か
-
<termNote type="preferred">
真か偽か
-
<termNote type="exactMatch">
真か偽か
-
<termNote type="status">
新規または承認済み
-
<termNote type="caseSensitive">
真か偽か
-
<termNote type="createdBy">
フレーズ ユーザー名
-
<termNote type="createdAt">
Unix 時間
-
<termNote type="lastModifiedBy">
フレーズ ユーザー名
-
<termNote type="lastModifiedAt">
Unix 時間
-
<termNote type="shortTranslation">
-
<termNote type="termType">
.XLSX ファイルは、インポートする前に特定の形式に整形する必要があります。
日付または時間の値を含むファイルをインポートする際は、セルが 有効な Excel 日付/時間値 としてフォーマットされていることを確認し、プレーンテキストとしてではありません。
ファイルを準備するには、次の手順に従ってください:
-
.XLSX ファイル内で、すべての用語を列に整理し、各列が一つの言語を表すようにします。
-
最初の行に、各言語の 言語コード を適用します。
例::
-
ファイルを保存します。
同義語
同義語は、同じ言語コードを持つ第二の列を追加することで対応できます。
例::
属性を持つ用語
用語は指定された属性と共にインポートできます。いくつかはPhraseによって生成され、Phrase TBからエクスポートされたファイルにのみ利用可能です。
用語に属性を適用するには、次の手順に従ってください:
複雑な形態を持つ用語
インポートされる用語は、用語ベースで直接作成された用語と同じ形態ルールに従います。
同義語やあいまい一致/完全一致で作業することに加えて、単語の語幹(変わらない部分)と接尾辞(変わる部分)の間に境界としてパイプ文字を追加できます。
例::
用語のインポート(およびエクスポート)には.TBX形式がサポートされています。.TBX標準は緩やかな標準と見なされています。他のCATツールから.TBXファイルがインポートされる場合、一部のメタデータがインポートされない可能性があります。
2つの用語ベース間で用語をインポートする場合は、.TBXファイル形式を使用してください。Phrase環境内では、データが正しくインポートされます。
SDL Tradosは特別なTBX.XMLファイル形式を使用しており、インポートのための異なる仕様があります。
Multiterm .TBX
Multiterm .TBXファイルからのインポートプロセスは最適化されており、以下のメタデータがインポートされます:
-
タイムスタンプ(作成日時、最終更新日時)
-
要素
<descrip type="usageNote">の値を、概念のすべての用語の属性usageに設定します。 -
要素
<descrip type="note">の値を、概念のすべての用語の属性noteに設定します。
SDL Tradosは用語ベースのための.TBXファイル形式をサポートしておらず、TBXスキーマを持つ.XMLファイル形式を使用しています。この.XMLファイル形式のインポートはサポートされていますが、すべての属性ではありません。
全体の用語概念に指定された属性は、各個別の用語のNoteに追加されます(各言語、各同義語など)。
インポートされた属性:
-
原文
-
訳文
-
同義語
-
作成日
-
最終更新日
-
作成者とレビュワーの名前
これらは、名前が既存のPhraseユーザーのユーザー名と同じである場合にのみインポートされます。TBX.xmlの名前を編集するか、ユーザーをPhraseに追加してください。
-
カスタマイズされた属性
これらは用語のノートにインポートされます。各属性は、属性名で始まる別の行を持ちます。以下に例を挙げます:
-
出典:Wikipedia
-
テーマ:法律
-
ステータス:新規
-
インポート前にTBX.xmlを編集してください。
データを最大限に活用するために、インポート前にTBX.xmlファイルを編集してください。ファイルを編集するには、マルチライン正規表現をサポートするテキストエディタ(例えばNotepad++)で開き、検索と置換機能で正規表現を使用できる必要があります。
編集ノート、使用法、ステータス
TBX.xmlファイルのカスタマイズされた属性は、次の形式を持っています。属性の実際の名前は標準化されていないため異なります:
<descripGrp> <descrip type="Comment">term =API= は翻訳されるべきではありません</descrip> </descripGrp> <descripGrp> <descrip type="Definition">API = アプリケーションプログラミングインターフェース</descrip> </descripGrp> <descripGrp> <descrip type="Example">Phraseは一連のAPI呼び出しを提供します。</descrip> </descripGrp> <descripGrp> <descrip type="Status">confirmed</descrip> </descripGrp>
これらの属性は自動的にノートにインポートされます:
-
コメント:term =API= は翻訳されるべきではありません
-
定義: API = アプリケーションプログラミングインターフェース
-
例: Phraseは一連のAPI呼び出しを提供します
-
ステータス: 確定済
この動作を変更し、インポートするには、例えば:
-
コメントをノートとして
-
例を使用法として
-
ステータスは承認済みまたは新規
-
定義のインポートは必要ありません
TBX.xmlファイルを編集して、.TBXファイルのPhrase形式の標準に合わせます:
<note>term =API=は翻訳されるべきではありません</note> <termNote type="usageNote">Phraseは一連のAPI呼び出しを提供します。</termNote> <termNote type="status">Approved</termNote>
コメントをノートに変更する
検索:
<descripGrp>.[^\<]+<descrip type="Comment">([^\<]+)</descrip>.[^\<]+</descripGrp>
置換:
<note>\1</note>
例を使用法に変更する
検索:
<descripGrp>.[^\<]+<descrip type="Example">([^\<]+)</descrip>.[^\<]+</descripGrp>
置換:
<termNote type="usageNote">\1</termNote>
ステータスを承認済みに設定する
検索:
<descripGrp>.[^\<]+<descrip type="Status">[^\<]+</descrip>.[^\<]+</descripGrp>
置換:
<termNote type="status">Approved</termNote>
定義を削除する定義
<descripGrp>.[^\<]+<descrip type="Definition">([^\<]+)</descrip>.[^\<]+</descripGrp>
空欄で置き換えます。
ノートに作成者を追加しています。
<transacGrp / origination>要素から作成者を削除し、<descript>要素に追加します。
<transacGrp> <transac type="terminologyManagementTransactions">origination</transac> <date>2006-09-27T11:25:19</date> <transacNote type="responsibility">MikeS</transacNote> </transacGrp>
次のように置き換えられるべきです:
<transacGrp> <transac type="terminologyManagementTransactions">origination</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="author">MikeS</descrip> </descripGrp>
正規表現は次のようになります:
検索:
(origination</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
置換:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="author">\2</descrip>\r\n</descripGrp>
ノートに編集者を追加しています。
編集者をノートに追加するには、<transacGrp / modification>要素からエディタを削除し、<descript>要素に追加します。
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> <transacNote type="responsibility">lauraB</transacNote> </transacGrp>
次のように置き換えられるべきです:
<transacGrp> <transac type="terminologyManagementTransactions">modification</transac> <date>2006-09-27T11:25:19</date> </transacGrp> <descripGrp> <descrip type="Edited by">lauraB</descrip> </descripGrp>
正規表現は次のようになります:
検索:
(modification</transac>.[^\<]+<date>[^\<]+</date>.[^\<]+)<transacNote type="responsibility">([^\<]+)</transacNote>.[^\<]+</transacGrp>
置換:
\1</transacGrp>\r\n<descripGrp>\r\n<descrip type="edited by">\2</descrip>\r\n</descripGrp>
関連するユーザー権限を持つ管理者またはプロジェクトマネージャーは、修正のために用語を.XLSXファイルにエクスポートし、その後ファイルを再インポートできます。これは一括変更または削除に使用できます。用語ベースは一度に一つずつしかエクスポートできません。
次の手順では、.XLSXファイルがエクスポートされたのと同じ用語ベースにインポートされる必要があります。異なる用語ベースにインポートされた場合、用語は更新されるのではなく重複し、削除のためにマークされた用語は削除されません。
二次エクスポートを.TBX形式でバックアップとして作成することをお勧めします。修正されたインポートが不正確だった場合に備えて。
外部で用語を修正するには、次の手順に従ってください:
-
用語ベースページから、ページの上部にある
メニューでエクスポートをクリックします。
ウィンドウが開きます。
-
としてエクスポートすることを選択します。
-
とのドロップダウンメニューでエクスポートする概念および用語属性を選択します。
システム定義の属性は、ロックアイコン
と共に表示されます。
備考
用語ベースをエクスポートする際は、システム属性のみが含まれます。カスタムフィールドのエクスポートはサポートされていません。
-
エクスポートをクリックします。
.XLSXファイルが作成され、システムにダウンロードされます。
-
.XLSXファイルを必要な変更で修正し、CIDまたはTID情報を削除しないでください。
メタデータ(作成日、修正日など)を使用して、スプレッドシートアプリケーションで特定のグループのみを表示するように用語をフィルタリングできます。
-
更新中
用語を更新するには、指定された言語の列に既存の用語を書き直します。
翻訳メモリとは異なり、
|更新サフィックスは必須ではありませんが、CIDまたはTIDに追加すると正しく機能します。新しい用語は、指定された言語の列に追加の行として追加でき、既存の用語ベースに新しいものとしてインポートされます。
-
削除中
用語は次の方法で削除できます:
-
用語をすべての言語から削除するために、用語のCIDに|削除を接尾辞として追加します。
-
特定の言語から用語を削除するために、用語のTIDに|削除を接尾辞として追加します。
すべての言語(CID列)および特定の言語(TID列)で削除のために設定されている用語の例:
-
-
-
.XLSXファイルを保存し、既存の用語を更新オプションで再インポートします。