Nastavení importu souborů

.XML - rozšiřitelný značkovací jazyk (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není určen k překladu a pro úspěšný import vyžaduje další nastavení.

Výchozí nastavení je označeno hvězdičkou (*) a import se všechny elementy XML k překladu. Možnostmi importu lze změnit chování importu.

Chatboti umělé inteligence mohou být velmi efektivní při identifikaci problémů s formátem souborů založených na .XML.

Typy souborů

  • .XML

Možnosti importu

Prostá pravidla importu

  • Elementy

    Importovány jsou pouze vybrané elementy (tedy název, název, odstavec). Hvězdička (*) naimportuje všechny elementy.

  • Atributy

    Importovány jsou pouze vybrané atributy (tj. název, název, odstavec). Hvězdička (*) importuje všechny atributy.

  • Řádkové elementy určené k překladu

    Pokud je vybrána možnost Automaticky rozpoznat inline elementy, importují se všechny elementy v překládaném textu jako inline elementy překládaného textu.

  • Řádkové elementy neurčené k překladu

    Vybraný název, název řádkového elementu bude převeden na tagy a obsah nebude překládán textem.

  • Automaticky rozpoznat inline elementy

    Elementy sousedící s textovými uzly budou automaticky převedeny na tagy na řádku.

  • Elementy (zpracované jako HTML)

    Vybraný kód elementu se zpracuje jako .HTML.. Pro tyto elementy lze použít nastavení importu HTML, jako je Zachovat bílé znaky nebo Break tag (<br/>), které vytvoří nový segment.

    Použijte tuto možnost, pokud vybraná hodnota elementu obsahuje značku .HTML. Neplatí pro podřízené vybraného elementu, pokud není uvedeno jinak.

  • Zamknuté elementy

    Vybrané elementy budou naimportovány jako zamknuto.

  • Zamknuté atributy

    Vybrané atributy budou naimportovány jako zamknuto.

  • Extrahovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Importovat XML entity

    XML entity v DTD deklaraci budou naimportovány k překladu.

  • Segmentovat XML

    Odznačte, pokud segmentace není žádoucí.

  • Importovat komentáře

    Komentáře se neimportují, pokud jsou elementy zpracovány jako HTML, jak je uvedeno v volbě Elementy (zpracovány jako HTML).

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy a převeďte zadaný text na tagy.

  • Převést na znakové entity

    Do výstupu souboru zadejte seznam číselných znaků (oddělených čárkami).

    Příklad:

    Pokud jsou vyžadovány uvozovky (), budou reprezentovány jako , znak Σ jako &#x3A3; použijte „,&#x3A3; . & a < budou vždy exportovány jako &amp; respektive &lt;.

Nastavení XML pomocí XPath

Používání jazyka dotazů XPath umožňuje vytvářet složitá pravidla importu a některé další funkce, které pravidla prostého importu nedodávají.

XPath výraz by měl definovat elementy a/nebo atributy, jejichž text/hodnota by se měla přeložit, a nikoli skutečný textový uzel.

Před použitím doporučujeme seznámení s XPath.

Kontextová poznámka, Kontextový klíč a max. délka cíle nebudou zpracovány u souborů obsahujících více než 10 000 elementů XML.

  • Kontextový klíč

    Případně tvoří kontext TM (101% shody).

  • Kontextová poznámka

    Import elementů nebo atributů kontextu pro každý element.

  • Max. délka cílového segmentu

    Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextových poznámek v editoru. Znaky překračující limit jsou zvýrazněny červeně.

  • Zachovat bílé znaky

    Prázdné pole - zachovat bílé znaky v elementech. Použijte xml:whitespace='preserve'. //*, aby byly zachovány všechny bílé znaky ve všech elementech, nebo použijte odpovídající výraz pro filtr XPath.

Náhled HTML se stylistikou XSLT

Jazyk XSLT (Extensible Stylesheet Language Transformations) lze použít k transformaci dokumentů .XML do formátu .HTML pro účely kontextového náhledu. Soubory s náhledem stažené prostřednictvím překladu náhledu v nabídce Dokument mají proto příponu HTML. Phrase aktuálně podporuje XSLT 2.0.

Pro import šablony stylů klikněte na tlačítko Vybrat soubor.

Kliknutím na tlačítko Stáhnout XSLT si stáhnete stylistiku po importu souboru.

CDATA v souboru XML

CDATA znamená data znaků a je definována jako bloky textu, které analyzátor nezpracovává, ale jsou rozpoznány jako značky. Předdefinované entity jako &lt;, &gt; a &amp; vyžadují psaní a obecně jsou ve značkách obtížně čitelné. V takových případech lze použít oddíl CDATA.

Pokud CDATA obsahuje vložený .HTML, měly by být odpovídající XML elementy uvedeny v sekci Elementy (zpracované jako HTML).

Pokud zdrojový soubor obsahuje CDATA a je použit segment XML, pak se CDATA přidá ke každému segmentu v Dokončeném souboru.

CDATA bude segmentována pouze v případě, že bude vymazat označení zalomení segmentu, jako je interpunkce nebo mezery.

Zdroj:

<text><![CDATA[Překládaný text text A. Překládaný text B.]]></text>

Cíl:

<text><![CDATA[Přeložitelný text A.]]><![CDATA[ ]]><![CDATA[Přeložitelný text B.]]></text>

Dokončený soubor je platný ve formátu .XML a prohlížeč XML zobrazí text správně jako překládaný text A. Překládaný text B.

Nastavení specifické pro aplikaci

Wordpress XML

Doporučená nastavení pro WordPress XML:

  • XML

    XPath

  • Elementy a atributy

    //*[local-name()='encoded']|//description|//title

  • Elementy (zpracované jako HTML)

    //*[local-name()='encoded']|//description|//title

  • Převést na tagy programu Phrase

    (\[[^\]]++\])++

V nastavení HTML vyberte Zachovat bílé znaky.

Vícejazyčné XML

Vícejazyčné soubory jsou importovány jako vícejazyčné zakázky s jazyky namapovanými před importem. V tabulce zakázek jsou zastoupeny souborem multilingual_xml.png. Pokud je soubor importován do několika jazyků cíle, skládá se Dokončený soubor ze všech jazyků cíle.

Phrase podporuje soubory XML, které mají ve všech odstavcích elementy zdroje i cíle, i když je cíl prázdný. Pokud se segmentace zdroje a cíle liší, rozhoduje segmentace zdroje.

Jednotlivé elementy jazyka musí být potomky jednoho elementu trans-jednotky a jeden jazyk nesmí být obsažen v druhém. zdroj a cíl obsah nelze ukládat do hodnot atributů. Při shodě více elementů s XPath pro zdroj nebo cíl uvnitř elementu trans-jednotka se k překladu importuje pouze první z nich.

  • Při vytváření zakázky vyberte před použitím možností importu vícejazyčné XML v podokně Typ souboru. Není-li určeno, soubor se naimportuje jako standardní .XML.

  • Obsah tagů zdrojového souboru .XML lze zobrazit v editoru kliknutím na tlačítko Rozbalit tagy v nabídce Nástroj a upravit kliknutím na F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného elementu <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Text nelze překládat textem.
<tu note="Kontextová poznámka" klíč="ID 254" maxlen="16"> 
  <tuv lang="cs">
    <seg>První segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="jiná kontextová poznámka" klíč="ID 255" maxlen="18"> 
  <tuv lang="cs">
    <seg>Druhý segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných souborů .XML se musí použít jazyk dotazu XPath. Reference viz výše uvedený příklad. Výraz XPath definuje elementy, ve kterých se má text/hodnota přeložit, a nikoli skutečný textový uzel.

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //tu

  • Elementy obsahující zdrojový text

    tuv[@lang='cs']/seg (ve vztahu k hlavnímu elementu //tu)

  • Elementy obsahující cílový text

    tuv[@lang='de']/seg (ve vztahu k prvku paKontextová poznámka rent //tu)

  • Elementy obsahující cílový text

    tuv[@lang='fr']/seg (ve vztahu k hlavnímu elementu //tu)

  • Řádkové elementy neurčené k překladu

    Všechny elementy ve zdroji nebo cíli jsou považovány za inline elementy překládaného textu, pokud zde nejsou uvedeny jako inline elementy nepřekládaného textu.

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy a převeďte zadaný text na tagy.

  • Kontextový klíč

    Určete kontextový klíč, který se uloží se segmentem do překladové paměti a použije se pro kontext shod.

  • Kontextová poznámka

    Import elementů nebo atributů kontextu pro každý element.

  • Max. délka cílového segmentu

    Import elementů nebo maximální délka cíle pro každý element

  • Převést na znakové entity

    Do výstupu souboru zadejte seznam číselných znaků (oddělených čárkami).

    Příklad:

    Pokud jsou vyžadovány uvozovky (), budou reprezentovány jako , znak Σ jako &#x3A3; použijte „,&#x3A3; . & a < budou vždy exportovány jako &amp; respektive &lt;.

  • Extrahovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Použít podfiltr HTML 

    Importuje HTML tagy obsažené v souboru. Tagy pak lze použít v nastavení importu HTML souboru. Odstavcové tagy <p> vytvoří nové segmenty, i když není vybrán segment vícejazyčného XML.

  • Segmentovat vícejazyčné XML

    Text je segmentován obecným pravidlem segmentace, nikoli jedním segmentem na buňku.

    Pozor

    Použití vícejazyčného XML segmentů na soubor, který obsahuje text cíle, může vést k jinému počtu segmentů ve zdroji než v cíli.

  • Nastavit stav segmentů s neprázdným cílem 

    Vyberte výchozí stav potvrzení a zda se potvrzeno segmenty automaticky přidávají do TM.

Příklad:

Pokud vícejazyčné .XML obsahuje obor názvů, může být XPath následující:

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //*[local-name()='trans-unit']

  • Elementy obsahující zdrojový text

    *[local-name()='zdroj']

  • Elementy obsahující cílový text

    *[local-name()='target']

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.