.XML – Extensible Markup Language (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není navržen pro překlad a vyžaduje další nastavení pro úspěšný import.

Výchozí nastavení jsou označena hvězdičkou (*) a importují všechny XML elementy pro překlad. Možnosti import lze použít ke změnit chování import.

Služby umělá inteligence mohou být velmi účinné při identifikaci problémů s formát v souborech založených na .XML.

Typy souborů

.XML

Možnosti importu

Pravidla pro jednoduchý import

Elementy

Importovány jsou pouze vybrané elementy (tj. name, title, para). Hvězdička (*) importuje všechny elementy.
Atributy

Importovány jsou pouze vybrané atributy (tj. name, title, para). Hvězdička (*) importuje všechny atributy.
Řádkové elementy určené k překladu

Pokud je vybrána možnost Identifikovat řádkové elementy automaticky, všechny elementy v překládaný text jsou importovány jako elementy Překládaný řádkový element.
Řádkové elementy neurčené k překladu

Vybraný řádkový element name, title, para bude převeden na tagy a obsah nebude překládaný text.

Důležité

Problémy s tagy jsou častou příčinou chyb při stáhnout (např. Soubor nelze vygenerovat), zejména u typů souborů, jako jsou tabulky (založené na MS Excel) a .XML. Před stáhnout souborů vždy zajistěte správnost tagů a formátování spuštěním kontrola kvality.
Automaticky rozpoznat inline elementy

Elementy, které sousedí s textovými uzly, budou automaticky převedeny na řádkové tagy.
Elementy (zpracované jako HTML)

Kód vybraného elementu je zpracován jako .HTML. Pro tyto elementy lze použít nastavení import pro .HTML, jako je Zachovat mezery nebo Zlomový tag (<br/>) vytvoří nový segment.

Tuto možnost použít, pokud hodnota vybraného elementu obsahuje značky .HTML. Nevztahuje se na potomky vybraného elementu, pokud není uvedeno jinak.
Zamknuté elementy

Vybrané elementy budou importovány jako zamknuto.
Zamknuté atributy

Vybrané atributy budou importovány jako zamknuto.
Převést na znakové entity

Zadejte seznam odkazů na znaky (oddělené čárkami) do výstupního souboru.

Příklad:

Pokud jsou vyžadovány uvozovky ("), byly by reprezentovány jako ", znak Σ by byl reprezentován jako Σ použijte ",Σ . & a < jsou vždy exportovány jako & a <.
Převést na tagy Phrase TMS

Použijte regulární výrazy a převeďte zadaný text na tagy.
Extrahovat zprávy ICU

ICU zprávy jsou automaticky převedeny na tagy. Pokud segment obsahuje vložené elementy, analýza ICU pro tento segment je přeskočena. Segmenty bez vložených elementů jsou analyzovány normálně.
Importovat XML entity

XML entity v Deklaraci DTD budou importovány pro překlad.
Rozšířit vlastní obecné entity
Importovat komentáře

Komentáře nejsou importovány, pokud jsou elementy zpracovávány jako HTML, jak je uvedeno v možnosti Elementy (zpracované jako HTML).
Vyloučit podřízené prvky ze segmentace

Vyberte pro zabránění segmentaci uvnitř párů XML tagů nebo subelementů. To je užitečné, pokud XML obsahuje vnořené struktury, kde by segmentace narušila logický význam textu.
Vytvořit soubor XSLT pro náhled

Lze nahrát .XSL šablonu a nechat z ní vygenerovat čitelný náhledový soubor.

Nastavení XML pomocí XPath

Použití dotazovacího jazyka XPath umožňuje vytváření komplexních pravidel pro import a některé další funkce, které nejsou v běžných pravidlech pro import dostupné.

Výraz XPath by měl definovat elementy a/nebo atributy, jejichž text/hodnota má být přeložena, nikoliv samotný textový uzel.

Před použitím se doporučuje seznámit se s XPath.

Kontextová poznámka, kontextový klíč a Max. délka cíle nebudou zpracovány u souborů s více než 10 000 XML elementy.

Kontextový klíč

V relevantním případě představuje kontext TM (101% shody).

Pokud není pro kontextový klíč zadán žádný výraz XPath, XML filtr ve výchozím nastavení kontextový klíč nevygeneruje. Chcete-li vygenerovat kontextový klíč na základě strukturální cesty segmentu, nastavte Kontext segmentu na Klíč segmentu v nastavení importu shod v překladové paměti.
Kontextová poznámka

Importujte elementy nebo kontextové atributy pro každý element.
Max. délka cílového segmentu

Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextových poznámek v editoru. Všechny znaky překračující limit jsou zvýrazněny červeně.
Zachovat bílé znaky

Ponechte prázdné pro zachování bílých znaků v elementech. Použijte xml:whitespace='preserve'. //* pro zachování všech bílých znaků ve všech elementech, nebo použijte libovolný výraz XPath.
Uzly vyloučené ze segmentace

Určete XML elementy nebo atributy, které by neměly být segmentovány. Zadejte výraz XPath, který identifikuje uzly, které mají být vyloučeny. Jakýkoli text extrahovaný z těchto uzlů bude ponechán jako jeden segment namísto rozdělení na menší jednotky.

Zadejte //element[@attr='value'] pro vyloučení všech <element> uzlů, které obsahují atribut attr=\"value\", ze segmentace.

Náhled HTML s šablonou stylů XSLT

Jazyk XSLT (Extensible Stylesheet Language Transformations) lze použít k transformaci .XML dokumentů do formátu .HTML pro účely náhledu v kontextu. V souladu s tím jsou soubory náhledu stažené přes Náhled překladu v nabídce Dokument dodávány s příponou HTML. Phrase v současnosti podporuje XSLT 2.0.

XSLT použité pro náhled musí být založeno na cíli, nikoli na zdroji.

Klikněte na Vybrat soubor pro import šablony stylů.

Klikněte na Stáhnout XSLT pro stažení šablony stylů po importu souboru.

CDATA v souboru XML

CDATA znamená znaková data (Character Data) a je definováno jako bloky textu, které nejsou zpracovávány parserem, ale jsou rozpoznány jako značky. Předdefinované entity jako <, > a & vyžadují psaní a jsou obecně obtížně čitelné ve značkách. V takových případech lze použít sekci CDATA.

Pokud CDATA obsahuje vložené .HTML, odpovídající XML elementy by měly být uvedeny pod Elementy (zpracované jako HTML).

Pokud zdrojový soubor obsahuje CDATA a je použito Segmentovat XML, pak je CDATA přidáno ke každému segmentu v dokončeném souboru.

CDATA bude segmentováno pouze tehdy, pokud existuje jasný náznak konce segmentu, jako je interpunkce nebo mezery.

Zdroj:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

Cíl:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

Dokončený soubor je platné .XML a prohlížeč XML zobrazí text správně jako Překládaný text A. Překládaný text B.

Nastavení specifická pro aplikaci

Wordpress XML

Doporučené nastavení pro Wordpress XML:

XML

XPath
Elementy a atributy

//*[local-name()='encoded']|//description|//title
Elementy (zpracované jako HTML)

//*[local-name()='encoded']|//description|//title
Převést na tagy programu Phrase

(\[[^\]]++\])++

Vybrat Zachovat mezery v nastavení HTML.

Vícejazyčné XML

Vícejazyčné soubory jsou importovány jako několik dvojjazyčných zakázek s jazyky namapovanými před importem. Jsou reprezentovány pomocí v tabulce zakázek. Pokud jsou importovány do několika cílových jazyků, dokončený soubor se skládá ze všech cílových jazyků.

Phrase podporuje soubory XML, které mají pro všechny odstavce přítomny prvky zdroj i cíl, i když je cíl prázdný. Pokud se segmentace zdroj a cíl liší, je určující segmentace zdroj.

Jednotlivé jazykové prvky musí být všechny potomky stejného prvku trans-unit a jeden jazyk nemůže být obsažen v druhém. Obsah zdroj a cíl nelze ukládat do hodnot atributů. Pokud se v prvku trans-unit shoduje s XPath pro zdroj nebo cíl více prvků, importuje se pro překlad pouze první z nich.

Při vytváření zakázky vyberte Vícejazyčné XML z podokna Typ souboru před použitím možností importu. Pokud není určeno jinak, soubor bude importován jako standardní .XML.
Obsah tagu zdrojového souboru .XML lze v editoru vizualizovat kliknutím na Rozbalit tagy v nabídce Nástroj a upravit kliknutím na F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang=\"en\">, <tuv lang=\"de\"> a <tuv lang=\"fr\"> jsou hlavními prvky stejného <tu> elementu.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřekládaný text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>První segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>První segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note=\"další kontextová poznámka\" key=\"ID 255\" maxlen=\"18\"> 
  <tuv lang="en">
    <seg>Druhý segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných souborů .XML musí být použit dotazovací jazyk XPath. Viz příklad výše pro referenci. Výraz XPath definuje elementy, ve kterých by měl být text/hodnota přeložen, nikoliv samotný textový uzel.

Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

//tu
Elementy obsahující zdrojový text

tuv[@lang='en']/seg (ve vztahu k hlavnímu elementu //tu)
Řádkové elementy neurčené k překladu

Všechny elementy ve zdroji nebo cíli jsou považovány za překládaný text vložených elementů, pokud zde nejsou specifikovány jako nepřekládaný text vložených elementů.
Kontextový klíč

Specifikujte kontextový klíč, který se uloží se segmentem do překladové paměti a použije se pro kontext shody.
Kontextová poznámka

Importujte elementy nebo kontextové atributy pro každý element.
Max. délka cílového segmentu

Import elementů nebo maximální délka cíle pro každý element
Převést na znakové entity

Zadejte seznam odkazů na znaky (oddělené čárkami) do výstupního souboru.

Příklad:

Pokud jsou vyžadovány uvozovky ("), byly by reprezentovány jako ", znak Σ by byl reprezentován jako Σ použijte ",Σ . & a < jsou vždy exportovány jako & a <.
Převést na tagy Phrase TMS

Použijte regulární výrazy a převeďte zadaný text na tagy.
Extrahovat zprávy ICU

ICU zprávy jsou automaticky převedeny na tagy. Pokud segment obsahuje vložené elementy, analýza ICU pro tento segment je přeskočena. Segmenty bez vložených elementů jsou analyzovány normálně.
Použít podfiltr HTML

Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML. Tagy odstavců <p> vytvoří nové segmenty, i když je Segmentace vícejazyčného XML nezaškrtnuta.
Použít podfiltr HTML

Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML.
Segmentovat vícejazyčné XML

Text je segmentován podle obecného pravidla segmentace namísto jednoho segmentu na buňku.

Pozor

Použití vícejazyčného segmentu XML na soubor, který obsahuje cílový text, může mít za následek odlišný počet segmentů ve zdroji než v cíli.
Nastavit stav segmentů s neprázdným cílem

Vybrat výchozí stav potvrzení a zda se potvrzené segmenty automaticky přidávají do TM.
Vytvořit soubor XSLT pro náhled

Lze nahrát .XSL šablonu a nechat z ní vygenerovat čitelný náhledový soubor.

Příklad:

Pokud vícejazyčný .XML obsahuje jmenný prostor, XPath může být následující:

Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

//*[local-name()='trans-unit']
Elementy obsahující zdrojový text

*[local-name()='zdroj']
Elementy obsahující cílový text

*[local-name()='cíl']

.XML – Extensible Markup Language (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Typy souborů

Možnosti importu

Důležité

Náhled HTML s šablonou stylů XSLT

CDATA v souboru XML

Nastavení specifická pro aplikaci

Wordpress XML

Vícejazyčné XML

Možnosti importu

Pozor