.XML - Rozšiřitelný značkovací jazyk (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není navržen pro překlad a vyžaduje další nastavení pro úspěšný import.

Výchozí nastavení jsou označena hvězdičkou (*) a importují všechny XML prvky k překladu. Možnosti importu lze použít k změně chování importu.

Služby umělé inteligence mohou být velmi efektivní při identifikaci problémů s formátem v souborech založených na .XML.

Typy souborů

.XML

Možnosti importu

Obecná pravidla importu

Prvky

Pouze vybrané prvky (tj. název, titulek, odstavec) jsou importovány. Hvězdička (*) importuje všechny prvky.
Attributes

Pouze vybrané atributy (tj. název, titulek, odstavec) jsou importovány. Hvězdička (*) importuje všechny atributy.
Překládané řádkové prvky

Pokud je vybrána možnost Automaticky identifikovat řádkové prvky, všechny prvky v překládaném textu jsou importovány jako Překládané řádkové prvky.
Nepřekládané řádkové prvky

Vybraný řádkový prvek název, titulek, odstavec bude převeden na značky a obsah nebude překládaný.

Důležité

Problémy s tagy jsou běžnou příčinou chyb při exportu (např. Soubor se nepodařilo vygenerovat), zejména u typů souborů, jako jsou tabulky (na bázi MS Excel) a .XML. Vždy se ujistěte, že jsou tagy a formátování správné před exportem souborů provedením kontrol kontroly kvality.
Automaticky identifikovat inline prvky

Prvky, které jsou sousedy textových uzlů, budou automaticky převedeny na inline tagy.
Prvky (zpracovány jako HTML)

Vybraný kód prvku je zpracován jako .HTML. .HTML nastavení importu, jako jsou Zachovat bílé znaky nebo Tag pro zlomení (<br/>) vytváří nový segment, mohou být použity pro tyto prvky.

Použijte tuto možnost, když hodnota vybraného prvku obsahuje .HTML značkování. Nepoužívá se na děti vybraného prvku, pokud není uvedeno jinak.
Zamknuté prvky

Vybrané prvky budou importovány jako Zamknuto.
Zamknuté atributy

Vybrané atributy budou importovány jako Zamknuto.
Převést na znakové entity

Zadejte seznam znakových referencí (oddělených čárkami) do výstupního souboru.

Příklad:

Pokud jsou potřebné uvozovky ("), budou reprezentovány jako ", znak Σ bude reprezentován jako Σ, použijte ",Σ. & a < jsou vždy exportovány jako & a < odpovídajícím způsobem.
Převést na tagy Phrase TMS

Použijte regulární výrazy k převodu zadaného textu na tagy.
Extrahovat zprávy ICU

ICU zprávy jsou automaticky převedeny na tagy. Pokud segment obsahuje inline prvky, zpracování ICU pro tento segment je přeskočeno. Segmenty bez inline prvků jsou zpracovány normálně.
Importovat XML entity

XML entity v DTD deklaraci budou importovány k překladu.
Rozšířit vlastní obecné entity
Importovat komentáře

Komentáře nejsou importovány, pokud jsou prvky zpracovány jako HTML, jak je uvedeno v možnosti Prvky (zpracované jako HTML).
Vyloučit podprvky ze segmentace

Vyberte, abyste zabránili segmentaci uvnitř XML párových značek nebo podprvků. To je užitečné, pokud XML obsahuje vnořené struktury, kde by segmentace narušila logický význam textu.
Vytvořit náhledový soubor XSLT

Stylový soubor .XSL může být nahrán a z něj může být vygenerován čitelný náhledový soubor.

XML nastavení pomocí XPath

Použití dotazovacího jazyka XPath umožňuje vytváření složitých pravidel importu a některých dalších funkcí, které nejsou k dispozici v běžných pravidlech importu.

Výraz XPath by měl definovat prvky a/nebo atributy, jejichž text/hodnota by měly být přeloženy, a nikoli skutečný textový uzel.

Doporučuje se znalost XPath před použitím.

Kontextová poznámka, Kontextový klíč a Max. délka cíle nebudou zpracovány pro soubory s více než 10 000 XML prvky.

Kontextový klíč

V relevantním případě představuje kontext TM (101% shody).
Kontextová poznámka

Importujte prvky nebo kontextové atributy pro každý prvek.
Max. délka cílového segmentu

Importujte prvky nebo maximální délku cíle pro každý prvek. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextová poznámka v editoru. Všechny znaky překračující limit jsou zvýrazněny červeně.
Zachovat bílé znaky

Nechte prázdné pro zachování bílých znaků v prvcích. Použijte xml:whitespace='preserve'. //* pro zachování všech bílých znaků ve všech prvcích, nebo použijte libovolný XPath výraz.
Uzly vyloučené ze segmentace

Specifikujte XML prvky nebo atributy, které by neměly být segmentovány. Zadejte XPath výraz, který identifikuje uzly, které mají být vyloučeny. Jakýkoli text extrahovaný z těchto uzlů bude zachován jako jeden segment, spíše než rozdělen na menší jednotky.

Zadejte //element[@attr='value'] pro vyloučení všech <element> uzlů, které obsahují atribut attr="value" ze segmentace.

HTML náhled s XSLT stylovým listem

XSLT jazyk (Extensible Stylesheet Language Transformations) může být použit k transformaci .XML dokumentů do .HTML formátu pro náhled v kontextu účely. Podle toho, náhledové soubory stažené přes Náhled překladu v menu Dokument přicházejí s HTML příponou. Phrase aktuálně podporuje XSLT 2.0.

XSLT použitý pro náhled musí být založen na cíli, nikoli na zdroji.

Klikněte Vybrat soubor pro import stylového listu.

Klikněte Stáhnout XSLT pro stažení stylového listu po importu souboru.

CDATA v XML souboru

CDATA znamená znaková data a je definováno jako bloky textu, které nejsou zpracovávány analyzátorem, ale jsou rozpoznávány jako značkování. Předdefinované entity jako <, > a & vyžadují psaní a obecně se obtížně čtou ve značkování. V takových případech lze použít sekci CDATA.

Pokud CDATA obsahuje vložené .HTML, měly by být odpovídající XML prvky uvedeny pod Prvky (zpracovány jako HTML).

Pokud zdrojový soubor obsahuje CDATA a je použit Segment XML, pak je CDATA přidáno do každého segmentu v dokončeném souboru.

CDATA bude segmentováno pouze v případě, že existuje jasné označení pro přerušení segmentu, jako je interpunkce nebo mezera.

Zdroj:

<text><![CDATA[Translatable text A. Translatable text B.]]></text>

Cíl:

<text><![CDATA[Translatable text A.]]><![CDATA[ ]]><![CDATA[Translatable text B.]]></text>

Dokončený soubor je platný .XML a XML prohlížeč zobrazí text správně jako Text k překladu A. Text k překladu B.

Specifická nastavení aplikace

Wordpress XML

Doporučená nastavení pro Wordpress XML:

XML

XPath
Prvky a atributy

//*[local-name()='encoded']|//description|//title
Prvky (zpracovány jako HTML)

//*[local-name()='encoded']|//description|//title
Převést na tagy programu Phrase

(\[[^\]]++\])++

Vyberte Zachovat bílé znaky v nastaveních HTML.

Vícejazyčný XML

Vícejazyčné soubory jsou importovány jako více dvojjazyčných zakázek s jazyky mapovanými před importem. Jsou reprezentovány jako v tabulce zakázky. Pokud jsou importovány do několika cílových jazyků, Dokončeno soubor se skládá ze všech cílových jazyků.

Phrase podporuje XML soubory, které mají přítomné jak zdrojové, tak cílové prvky pro všechny odstavce, i když je cíl prázdný. Když se zdrojová a cílová segmentace liší, zdrojová segmentace je určující.

Jednotlivé jazykové prvky musí být všechny potomky stejného trans-unit prvku a jeden jazyk nemůže být obsažen v druhém. Obsah zdroje a cíle nemůže být uložen v hodnotách atributů. Pokud více prvků odpovídá XPath pro zdroj nebo cíl uvnitř trans-unit prvku, pouze první je importován k překladu.

Při vytváření zakázky vyberte Vícejazyčný XML z panelu Typ souboru před použitím možností importu. Pokud není specifikováno, soubor bude importován jako standardní .XML.
Obsah tagu zdrojového .XML souboru může být vizualizován v editoru kliknutím na Rozšířit tagy v nabídce Nástroj a upraven kliknutím na F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného <tu> prvku.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřekládaný text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>První segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="další kontextová poznámka" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Druhý segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných .XML souborů musí být použito XPath dotazovací jazyk. Viz výše uvedený příklad pro referenci. Výraz XPath definuje prvky, ve kterých by měl být text/hodnota přeložena, a nikoli skutečný textový uzel.

Prvky obsahující podprvky zdroje a cíle

//tu
Prvky obsahující zdrojový text

tuv[@lang='en']/seg (ve vztahu k hlavnímu prvku //tu)
Nepřekládané řádkové prvky

Všechny prvky ve zdroji nebo cíli jsou považovány za překládané inline prvky, pokud zde nejsou specifikovány jako nepřekládané inline prvky.
Kontextový klíč

Specifikujte kontextový klíč, který je uložen se segmentem do překladové paměti a používá se pro kontext shody.
Kontextová poznámka

Importujte prvky nebo kontextové atributy pro každý prvek.
Max. délka cílového segmentu

Importujte prvky nebo maximální délku cíle pro každý prvek.
Převést na znakové entity

Zadejte seznam znakových referencí (oddělených čárkami) do výstupního souboru.

Příklad:

Pokud jsou potřebné uvozovky ("), budou reprezentovány jako ", znak Σ bude reprezentován jako Σ, použijte ",Σ. & a < jsou vždy exportovány jako & a < odpovídajícím způsobem.
Převést na tagy Phrase TMS

Použijte regulární výrazy k převodu zadaného textu na tagy.
Extrahovat zprávy ICU

ICU zprávy jsou automaticky převedeny na tagy. Pokud segment obsahuje inline prvky, zpracování ICU pro tento segment je přeskočeno. Segmenty bez inline prvků jsou zpracovány normálně.
Použít podfiltr HTML

Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML. Tagy odstavce <p> vytvoří nové segmenty, i když Segmentovat vícejazyčný XML není vybráno.
Použít podfiltr HTML

Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML.
Segmentovat vícejazyčný XML

Text je segmentován podle obecného pravidla segmentace spíše než jednoho segmentu na buňku.

Pozor

Použití Segmentovat vícejazyčný XML na soubor, který obsahuje cílový text, může vést k jinému počtu segmentů ve zdroji než v cíli.
Nastavit stav segmentů s neprázdným cílem

Vyberte výchozí stav potvrzení a zda jsou potvrzené segmenty automaticky přidávány do TM.
Vytvořit náhledový soubor XSLT

Stylový soubor .XSL může být nahrán a z něj může být vygenerován čitelný náhledový soubor.

Příklad:

Pokud vícejazyčný .XML obsahuje prostor názvů, XPath by mohl být následující:

Prvky obsahující podprvky zdroje a cíle

//*[local-name()='trans-unit']
Prvky obsahující zdrojový text

*[local-name()='source']
Elementy obsahující cílový text

*[local-name()='target']

.XML - Rozšiřitelný značkovací jazyk (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Typy souborů

Možnosti importu

Důležité

HTML náhled s XSLT stylovým listem

CDATA v XML souboru

Specifická nastavení aplikace

Wordpress XML

Vícejazyčný XML

Možnosti importu

Pozor