Nastavení importu souborů

.XML - Rozšiřitelný značkovací jazyk (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není určen k překladu a pro úspěšný import vyžaduje další nastavení.

Výchozí nastavení je označeno hvězdičkou (*) a importují se všechny elementy XML k překladu. Možnosti importu lze použít ke změně chování importu.

Typy souborů

 • .XML

Možnosti importu

Prostá pravidla importu

 • Elementy

  Importovány budou pouze vybrané elementy (tj. název, název, odstavec). Hvězdička (*) naimportuje všechny elementy.

 • Atributy

  Importovány budou pouze vybrané atributy (název, název, odstavec). Hvězdička (*) importuje všechny atributy.

 • Přeložitelné inline elementy

  Pokud je vybrána možnost Automaticky rozpoznat inline elementy, importují se všechny elementy v překládaném textu jako přeložitelné inline elementy.

 • Nepřeložitelné inline elementy

  Vybraný inline element name, title, para bude převeden na tagy a obsah nebude možno překládat.

 • Automaticky rozpoznat inline elementy

  Elementy sousedící s textovými uzly budou automaticky převedeny na tagy na řádku.

 • Elementy (zpracované jako HTML)

  Vybraný kód elementu je zpracován ve formátu .HTML. Pro tyto elementy lze použít nastavení importu ve formátu ..

 • Zamknuté elementy

  Vybrané elementy budou naimportovány jako zamknuté.

 • Zamknuté atributy

  Vybrané atributy budou naimportovány jako zamknuté.

 • Analyzovat zprávy ICU

  ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

 • Importovat XML entity

  XML entity v DTD deklaraci budou naimportovány k překladu.

 • Segmentovat XML

  Odznačte, pokud segmentace není žádoucí.

 • Importovat komentáře

  Komentáře se neimportují, pokud jsou elementy zpracovány jako HTML, jak je uvedeno v volbě Elementy (zpracovány jako HTML).

 • Převést na tagy Phrase TMS 

  Použijte regulární výrazy pro převod vybraného textu na tagy.

 • Převést na znakové entity

  Do vyexportovaného souboru zadejte seznam referenčních znaků (oddělených čárkami).

  Příklad:

  Pokud jsou vyžadovány uvozovky (), budou reprezentovány jako , znak Σ jako Σ použití Σ . & a < budou vždy reprezentovány jako & respektive <.

Nastavení XML pomocí XPath

Použití dotazovacího jazyka XPath umožňuje vytvářet složitá pravidla pro import a některé další funkce, které nejsou v pravidlech pro prostý import k dispozici.

Výraz pro XPath by měl definovat elementy a/nebo atributy, jejichž text/hodnota se má přeložit, a nikoli skutečný textový uzel.

Před použitím doporučujeme seznámit se s XPath.

Kontextová poznámka, kontextový klíč a maximální délka cíle nebudou zpracovány u souborů s více než 10 000 elementy XML.

 • Kontextový klíč

  Případně tvoří kontext překladové paměti (101% shody).

 • Kontextová poznámka

  Importujte elementy nebo kontextové atributy pro každý element.

 • Max. délka cílového segmentu

  Importovat elementy nebo maximální délku cílového segmentu pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextové poznámky v editoru. Jakýkoli znak překračující limit je zvýrazněn červeně.

 • Zachovat bílé znaky

  Prázdné pole - zachovat bílé znaky v elementech. Použijte xml:whitespace='preserve'. //*, aby byly zachovány všechny bílé znaky ve všech elementech, nebo použijte odpovídající výraz pro filtr XPath.

Náhled HTML se stylistikou XSLT

Jazyk XSLT (Extensible Stylesheet Language Transformations) lze použít k transformaci dokumentů .XML do formátu .HTML pro účely náhledu v kontextu. Náhled souborů stažených pomocí Náhledu překladu v nabídce Dokument má proto příponu HTML. Phrase v současné době podporuje XSLT 2.0.

Kliknutím na tlačítko Vybrat soubor importujete soubor stylů.

Kliknutím na tlačítko Stáhnout XSLT si po importu souboru stáhnete stylistiku.

CDATA v souboru XML

CDATA znamená znaková data a je definována jako bloky textu, které nejsou zpracovány analyzátorem, ale jsou rozpoznány jako značky. Předdefinované entity jako <, > a & vyžadují psaní a obecně jsou v značkách obtížně čitelné. V takových případech lze použít oddíl CDATA.

Pokud CDATA obsahuje vložený .HTML, měly by být odpovídající XML elementy uvedeny v části Elementy (zpracované jako HTML).

Pokud zdrojový soubor obsahuje CDATA a je použit Segment XML, přidá se CDATA ke každému segmentu v Dokončeném souboru.

CDATA bude segmentována pouze v případě, že je zřetelně indikováno zalomení segmentu, jako je interpunkce nebo mezery.

Zdroj:

<text><![CDATA[Přeložitelný text A. Přeložitelný text B.]]></text>

Cíl:

<text><![CDATA[Přeložitelný text A.]]><![CDATA[ ]]><![CDATA[Přeložitelný text B.]]></text>

Dokončený soubor je platný ve formátu .XML a prohlížeč XML zobrazí text správně jako přeložitelný text A. Přeložitelný text B.

Nastavení pro konkrétní aplikace

Wordpress XML

Doporučené nastavení pro Wordpress XML:

 • XML

  XPath

 • Elementy a atributy

  //*[local-name()='encoded']|//description|//title

 • Elementy (zpracované jako HTML)

  //*[local-name()='encoded']|//description|//title

 • Převést na tagy programu Phrase

  (\[[^\]]++\])++

V nastavení HTML vyberte možnost Zachovat bílé znaky.

Vícejazyčné XML

Vícejazyčné soubory jsou importovány jako vícejazyčné zakázky s jazyky namapovanými před importem. V tabulce zakázek jsou zastoupeny souborem multilingual_xml.png. Při importu do více cílových jazyků se dokončený soubor skládá ze všech cílových jazyků.

Phrase podporuje soubory XML, které mají zdrojové i cílové elementy přítomné ve všech odstavcích, i když je cíl prázdný. Pokud se zdrojová a cílová segmentace liší, rozhoduje zdrojová segmentace.

Jednotlivé jazykové elementy musejí pocházet ze stejného elementu trans-unit a jeden jazyk nesmí být obsažen ve druhém. Zdrojový a cílový obsah nelze ukládat do hodnot atributů. Pokud více elementů odpovídá XPath pro zdroj nebo cíl uvnitř elementu trans-unit, importuje se k překladu pouze první z nich.

 • Při vytváření zakázky vyberte z podokna Typ souboru před použitím Možností importu možnost Vícejazyčné XML. Není-li zadáno, soubor se naimportuje jako standardní .XML.

 • Obsah tagů zdrojového souboru .XML lze zobrazit v editoru kliknutím na tlačítko Rozbalit tagy v nabídce Nástroj a upravit kliknutím na F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného elementu <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřeložitelný text.
<tu note="context note" key="ID 254" maxlen="16"> 
 <tuv lang="cs">
  <seg>První segment.</seg>
 </tuv>
 <tuv lang="de">
  <seg>Erste segment</seg>
 </tuv>
 <tuv lang="fr">
  <seg></seg>
 </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
 <tuv lang="cs">
  <seg>druhý segment.</seg>
 </tuv>
 <tuv lang="de">
  <seg></seg>
 </tuv>
 <tuv lang="fr">
  <seg></seg>
 </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných souborů .XML je třeba použít dotazovací jazyk XPath. Pro referenci viz výše uvedený příklad. Výraz XPath definuje elementy, ve kterých se má text/hodnota překládat, a nikoli skutečný textový uzel.

 • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

  //tu

 • Elementy obsahující zdrojový text

  tuv[@lang='en']/seg (ve vztahu k nadřazenému elementu //tu)

 • Elementy obsahující cílový text

  tuv[@lang='de']/seg (ve vztahu k elementu paContext Note rent //tu)

 • Elementy obsahující cílový text

  tuv[@lang='fr']/seg (ve vztahu k nadřazenému elementu //tu)

 • Nepřeložitelné inline elementy

  Všechny elementy ve zdrojovém nebo cílovém segmentu jsou považovány za inline elementy určené k překladu, pokud zde nejsou uvedeny jako inline elementy neurčené k překladu.

 • Převést na tagy Phrase TMS 

  Použijte regulární výrazy pro převod vybraného textu na tagy.

 • Kontextový klíč

  Zadejte kontextový klíč, který se uloží společně se segmentem do překladové paměti a použije se pro kontext shod.

 • Kontextová poznámka

  Importujte elementy nebo kontextové atributy pro každý element.

 • Max. délka cílového segmentu

  Importovat elementy nebo maximální délku cílového segmentu pro každý element

 • Převést na znakové entity

  Do vyexportovaného souboru zadejte seznam referenčních znaků (oddělených čárkami).

  Příklad:

  Pokud jsou vyžadovány uvozovky (), budou reprezentovány jako , znak Σ jako Σ použití Σ . & a < budou vždy reprezentovány jako & respektive <.

 • Analyzovat zprávy ICU

  ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

 • Použít podfiltr HTML 

  Importuje HTML tagy obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML. Tagy odstavce <p> vytvoří nové segmenty i v případě, že není vybrána možnost Segmentovat vícejazyčné XML.

 • Segmentovat vícejazyčné XML

  Text je segmentován obecným pravidlem pro segmentaci, nikoli jedním segmentem na buňku.

  Opatrnost

  Použití vícejazyčného XML segmentu na soubor obsahující cílový text může vést k jinému počtu segmentů ve zdrojovém textu než v cílovém.

 • Nastavit stav segmentů s neprázdným cílem 

  Vyberte výchozí stav potvrzení a zda se potvrzené segmenty automaticky přidávají do TM.

Příklad:

Pokud vícejazyčný .XML obsahuje obor názvů, může být XPath následující:

 • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

  //*[local-name()='trans-unit']

 • Elementy obsahující zdrojový text

  *[local-name()='source']

 • Elementy obsahující cílový text

  *[local-name()='target']

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.