Nastavení importu souborů

.XML - Extensible Markup Language (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není určen k překladu a pro úspěšný import vyžaduje další nastavení.

Výchozí nastavení je označeno hvězdičkou (*) a importuje všechny elementy XML k překladu. Možnosti import lze použít ke změnit chování import.

Chatboti umělé inteligence mohou být velmi efektivní při identifikaci problémů s formátem souborů založených na .XML.

Typy souborů

  • .XML

Možnosti importu

Prostá pravidla importu

  • Elementy

    Importovány budou pouze vybrané elementy (tj. název, název, odstavec). Hvězdička (*) importuje všechny elementy.

  • Atributy

    Importovány budou pouze vybrané atributy (tj. název, název, odstavec). Hvězdička (*) importuje všechny atributy.

  • Řádkové elementy určené k překladu

    Pokud je vybrána možnost Automaticky rozpoznat inline elementy, importují se všechny elementy v překládaném textu jako překládané inline elementy.

  • Řádkové elementy neurčené k překladu

    Vybraný název, název řádkového elementu bude převeden na tagy a obsah nebude překládán textem.

    Důležité

    Problémy s tagy jsou častou příčinou chyb stáhnout, zejména u typů souborů, jako jsou tabulky (na základě MS Excel) a .XML. Před exportem souborů se vždy ujistěte o správnosti tagů a formátování spuštěním kontroly kvality.

  • Automaticky rozpoznat inline elementy

    Elementy sousedící s textovými uzly budou automaticky převedeny na tags na řádku.

  • Elementy (zpracované jako HTML)

    Vybraný kód elementu se zpracuje jako .HTML. Pro tyto elementy lze použít nastavení importu .HTML, jako je Zachovat bílé znaky nebo Break tag (<br/>), které vytvoří nový segment.

    Použijte tuto možnost, pokud vybraná hodnota elementu obsahuje značku .HTML. Pokud není uvedeno jinak, neplatí to pro potomky vybraného elementu.

  • Zamknuté elementy

    Vybrané elementy budou naimportovány jako zamknuto.

  • Zamknuté atributy

    Vybrané atributy budou naimportovány jako zamknuto.

  • Extrahovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Importovat XML entity

    XML entity v DTD deklaraci budou naimportovány k překladu.

  • Segmentovat XML

    Zrušte výběr, pokud segmentace není žádoucí.

  • Importovat komentáře

    Komentáře nejsou naimportovány, pokud jsou elementy zpracovány jako HTML, jak je uvedeno v volbě Elementy (zpracovány jako HTML).

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy a převeďte zadaný text na tagy.

  • Převést na znakové entity

    Do výstupu souboru zadejte seznam odkazů na znaky (oddělený čárkami).

    Příklad:

    Jsou-li vyžadovány uvozovky ("), budou vyjádřeny jako &quot;, znak Σ jako &#x3A3; použijte &quot;,&#x3A3; . & a < budou vždy exportovány jako &amp; respektive &lt;.

Nastavení XML pomocí XPath

Použití jazyka dotazů XPath umožňuje vytvořit složitá pravidla importu a některé další funkce, které nejsou v pravidlech prostého importu k dispozici.

Výraz XPath by měl definovat elementy a/nebo atributy, jejichž text/hodnota by se měla přeložit, a nikoli skutečný textový uzel.

Před použitím doporučujeme seznámit se s XPath.

Kontextová poznámka, kontextový klíč a max. délka cíle nebudou zpracovány u souborů s více než 10 000 elementy XML.

  • Kontextový klíč

    V relevantním případě představuje kontext TM (101% shody).

  • Kontextová poznámka

    Import elementů nebo kontextových atributů pro každý element.

  • Max. délka cílového segmentu

    Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextových poznámek v editoru. Všechny znaky překračující limit jsou zvýrazněny červeně.

  • Zachovat bílé znaky

    empty pole - zachovat bílé znaky v elementech. Použijte xml:whitespace='preserve'. //* aby byly zachovány všechny bílé znaky ve všech elementech, nebo použijte odpovídající výraz pro filtr XPath.

Náhled HTML se stylistikou XSLT

Jazyk XSLT (rozšiřitelné prvky formátu Transjazyk stylistiky) lze použít k transformaci dokumentů .XML do formátu .HTML pro účely náhledu v kontextu. Náhled souborů stažených prostřednictvím Náhledu překladu v nabídce Dokumenty je proto dodáván s příponou HTML. Phrase aktuálně podporuje XSLT 2.0.

Pro import stylistiky klikněte na Vybrat soubor.

Kliknutím na tlačítko Stáhnout XSLT si po importu souboru stáhněte stylistiku.

CDATA v souboru XML

CDATA znamená Data znaků a je definována jako bloky textu, které parser nezpracovává, ale rozpoznává je jako značky. Předdefinované entity jako &lt;, &gt; a &amp; vyžadují přepisování a ve značkách jsou obecně obtížně čitelné. V takových případech lze použít oddíl CDATA.

Pokud CDATA obsahuje vložený .HTML, měly by být odpovídající elementy XML uvedeny v části Elementy (zpracované jako HTML).

Pokud soubor zdroje obsahuje CDATA a je použit segment XML, přidá se CDATA ke každému segmentu v Dokončeném souboru.

CDATA bude segmentována pouze v případě, že bude vymazat označení zalomení segmentu, jako je interpunkce nebo mezery.

Zdroj:

<text><![CDATA[Překládaný text text A. Překládaný text B.]]></text>

Cíl:

<text><![CDATA[Přeložitelný text A.]]><![CDATA[ ]]><![CDATA[Přeložitelný text B.]></text>

Dokončený soubor je platný .XML a prohlížeč XML zobrazí text správně jako překládaný text A. Překládaný text B.

Nastavení specifické pro aplikaci

Wordpress XML

Doporučené nastavení pro WordPress XML:

  • XML

    XPath

  • Elementy a atributy

    //*[local-name()='encoded']|//description|//title

  • Elementy (zpracované jako HTML)

    //*[local-name()='encoded']|//description|//title

  • Převést na tagy programu Phrase

    (\[[^\]]++\])++

V nastavení HTML vyberte Zachovat bílé znaky.

Multilingual XML

Vícejazyčné soubory jsou importovány jako vícejazyčné zakázky s jazyky namapovanými před importem. V tabulce zakázek jsou zastoupeny multilingual_xml.png. Při importu do několika jazyků cíle se dokončený soubor skládá ze všech jazyků cíle.

phrase podporuje soubory XML, které mají zdroj i cíl elementy přítomné ve všech odstavcích, i když je cíl empty. Pokud je segmentace zdroje a cíle odlišná, je určující segmentace zdroje.

Jednotlivé elementy jazyka musí být potomky jednoho elementu trans-jednotky a jeden jazyk nesmí být obsažen v druhém. zdroj a cíl obsah nelze ukládat do hodnot atributů. Dojde-li ke shodě více elementů s XPath pro zdroj nebo cíl v elementu trans-unit, importuje se k překladu pouze první z nich.

  • Při vytváření zakázky vyberte před použitím Možností importu vícejazyčné XML z podokna Typ souboru. Pokud není zadáno, importuje se soubor jako standardní .XML.

  • Obsah tagů zdrojového souboru .XML lze zobrazit v editoru kliknutím na tlačítko Expand tags v nabídce Nástroj a upravit kliknutím na položku F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného elementu <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřekládaný text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>První segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Druhý segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných souborů .XML se musí použít jazyk dotazu XPath. Reference viz výše uvedený příklad. Výraz XPath definuje elementy, ve kterých se má text/hodnota překládat, a nikoli skutečný textový uzel.

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //tu

  • Elementy obsahující zdrojový text

    tuv[@lang='cs']/seg (ve vztahu k hlavnímu elementu //tu)

  • Elementy obsahující cílový text

    tuv[@lang='de']/seg (ve vztahu k prvku paKontextová poznámka rent //tu)

  • Elementy obsahující cílový text

    tuv[@lang='fr']/seg (ve vztahu k hlavnímu elementu //tu)

  • Řádkové elementy neurčené k překladu

    Všechny elementy ve zdroji nebo cíli jsou považovány za inline elementy určené k překládanému textu, pokud zde nejsou uvedeny jako inline elementy určené k nepřekládanému textu.

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy a převeďte zadaný text na tagy.

  • Kontextový klíč

    Určete kontextový klíč, který se společně se segmentem uloží do překladové paměti a použije se pro kontext shod.

  • Kontextová poznámka

    Import elementů nebo kontextových atributů pro každý element.

  • Max. délka cílového segmentu

    Import elementů nebo maximální délka cíle pro každý element

  • Převést na znakové entity

    Do výstupu souboru zadejte seznam odkazů na znaky (oddělený čárkami).

    Příklad:

    Jsou-li vyžadovány uvozovky ("), budou vyjádřeny jako &quot;, znak Σ jako &#x3A3; použijte &quot;,&#x3A3; . & a < budou vždy exportovány jako &amp; respektive &lt;.

  • Extrahovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Použít podfiltr HTML 

    Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML. Tagy odstavců <p> vytvoří nové segmenty i v případě, že není vybrána možnost Segmentovat vícejazyčné XML.

  • Segmentovat vícejazyčné XML

    Text je segmentován obecným pravidlem segmentace, nikoli jedním segmentem na buňku.

    Pozor

    Použití vícejazyčného XML segmentu na soubor obsahující text cíle může vést k jinému počtu segmentů ve zdroji než v cíli.

  • Nastavit stav segmentů s neprázdným cílem 

    Vyberte výchozí stav potvrzení a zda se potvrzeno segmenty automaticky přidávají do TM.

Příklad:

Pokud vícejazyčný .XML obsahuje obor názvů, může být XPath následující:

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //*[local-name()='trans-unit']

  • Elementy obsahující zdrojový text

    *[local-name()='source']

  • Elementy obsahující cílový text

    *[local-name()='target']

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.