Nastavení importu souborů

.XML - Rozšiřitelný značkovací jazyk (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není určen k překladu a pro úspěšný import vyžaduje další nastavení.

Výchozí nastavení je označeno hvězdičkou (*) a importují se všechny elementy XML k překladu. Možnosti importu lze použít ke změně chování importu.

Typy souborů

  • .XML

Možnosti importu

Prostá pravidla importu

  • Elementy

    Importovány budou pouze vybrané elementy (tj. název, název, odstavec). Hvězdička (*) naimportuje všechny elementy.

  • Atributy

    Importovány budou pouze vybrané atributy (název, název, odstavec). Hvězdička (*) importuje všechny atributy.

  • Přeložitelné inline elementy

    Pokud je vybrána možnost Automaticky rozpoznat inline elementy, importují se všechny elementy v překládaném textu jako přeložitelné inline elementy.

  • Nepřeložitelné inline elementy

    Vybraný inline element name, title, para bude převeden na tagy a obsah nebude možno překládat.

  • Automaticky rozpoznat inline elementy

    Elementy sousedící s textovými uzly budou automaticky převedeny na tagy na řádku.

  • Elementy (zpracované jako HTML)

    Vybraný kód elementu je zpracován ve formátu .HTML. Pro tyto elementy lze použít nastavení importu ve formátu ..

  • Zamknuté elementy

    Vybrané elementy budou naimportovány jako zamknuté.

  • Zamknuté atributy

    Vybrané atributy budou naimportovány jako zamknuté.

  • Analyzovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Importovat XML entity

    XML entity v DTD deklaraci budou naimportovány k překladu.

  • Segmentovat XML

    Odznačte, pokud segmentace není žádoucí.

  • Importovat komentáře

    Komentáře se neimportují, pokud jsou elementy zpracovány jako HTML, jak je uvedeno v volbě Elementy (zpracovány jako HTML).

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy pro převod vybraného textu na tagy.

  • Převést na znakové entity

    Do vyexportovaného souboru zadejte seznam referenčních znaků (oddělených čárkami).

    Příklad:

    Pokud jsou vyžadovány uvozovky (), budou reprezentovány jako , znak Σ jako Σ použití Σ . & a < budou vždy reprezentovány jako & respektive <.

Nastavení XML pomocí XPath

Použití dotazovacího jazyka XPath umožňuje vytvářet složitá pravidla pro import a některé další funkce, které nejsou v pravidlech pro prostý import k dispozici.

Výraz pro XPath by měl definovat elementy a/nebo atributy, jejichž text/hodnota se má přeložit, a nikoli skutečný textový uzel.

Před použitím doporučujeme seznámit se s XPath.

Kontextová poznámka, kontextový klíč a maximální délka cíle nebudou zpracovány u souborů s více než 10 000 elementy XML.

  • Kontextový klíč

    Případně tvoří kontext překladové paměti (101% shody).

  • Kontextová poznámka

    Importujte elementy nebo kontextové atributy pro každý element.

  • Max. délka cílového segmentu

    Importovat elementy nebo maximální délku cílového segmentu pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextové poznámky v editoru. Jakýkoli znak překračující limit je zvýrazněn červeně.

  • Zachovat bílé znaky

    Prázdné pole - zachovat bílé znaky v elementech. Použijte xml:whitespace='preserve'. //*, aby byly zachovány všechny bílé znaky ve všech elementech, nebo použijte odpovídající výraz pro filtr XPath.

Náhled HTML se stylistikou XSLT

Jazyk XSLT (Extensible Stylesheet Language Transformations) lze použít k transformaci dokumentů .XML do formátu .HTML pro účely náhledu v kontextu. Náhled souborů stažených pomocí Náhledu překladu v nabídce Dokument má proto příponu HTML. Phrase v současné době podporuje XSLT 2.0.

Kliknutím na tlačítko Vybrat soubor importujete soubor stylů.

Kliknutím na tlačítko Stáhnout XSLT si po importu souboru stáhnete stylistiku.

CDATA v souboru XML

CDATA znamená znaková data a je definována jako bloky textu, které nejsou zpracovány analyzátorem, ale jsou rozpoznány jako značky. Předdefinované entity jako <, > a & vyžadují psaní a obecně jsou v značkách obtížně čitelné. V takových případech lze použít oddíl CDATA.

Pokud CDATA obsahuje vložený .HTML, měly by být odpovídající XML elementy uvedeny v části Elementy (zpracované jako HTML).

Pokud zdrojový soubor obsahuje CDATA a je použit Segment XML, přidá se CDATA ke každému segmentu v Dokončeném souboru.

CDATA bude segmentována pouze v případě, že je zřetelně indikováno zalomení segmentu, jako je interpunkce nebo mezery.

Zdroj:

<text><![CDATA[Přeložitelný text A. Přeložitelný text B.]]></text>

Cíl:

<text><![CDATA[Přeložitelný text A.]]><![CDATA[ ]]><![CDATA[Přeložitelný text B.]]></text>

Dokončený soubor je platný ve formátu .XML a prohlížeč XML zobrazí text správně jako přeložitelný text A. Přeložitelný text B.

Nastavení pro konkrétní aplikace

Wordpress XML

Doporučené nastavení pro Wordpress XML:

  • XML

    XPath

  • Elementy a atributy

    //*[local-name()='encoded']|//description|//title

  • Elementy (zpracované jako HTML)

    //*[local-name()='encoded']|//description|//title

  • Převést na tagy programu Phrase

    (\[[^\]]++\])++

V nastavení HTML vyberte možnost Zachovat bílé znaky.

Vícejazyčné XML

Vícejazyčné soubory jsou importovány jako vícejazyčné zakázky s jazyky namapovanými před importem. V tabulce zakázek jsou zastoupeny souborem multilingual_xml.png. Při importu do více cílových jazyků se dokončený soubor skládá ze všech cílových jazyků.

Phrase podporuje soubory XML, které mají zdrojové i cílové elementy přítomné ve všech odstavcích, i když je cíl prázdný. Pokud se zdrojová a cílová segmentace liší, rozhoduje zdrojová segmentace.

Jednotlivé jazykové elementy musejí pocházet ze stejného elementu trans-unit a jeden jazyk nesmí být obsažen ve druhém. Zdrojový a cílový obsah nelze ukládat do hodnot atributů. Pokud více elementů odpovídá XPath pro zdroj nebo cíl uvnitř elementu trans-unit, importuje se k překladu pouze první z nich.

  • Při vytváření zakázky vyberte z podokna Typ souboru před použitím Možností importu možnost Vícejazyčné XML. Není-li zadáno, soubor se naimportuje jako standardní .XML.

  • Obsah tagů zdrojového souboru .XML lze zobrazit v editoru kliknutím na tlačítko Rozbalit tagy v nabídce Nástroj a upravit kliknutím na F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného elementu <tu>.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřeložitelný text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="cs">
    <seg>První segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="cs">
    <seg>druhý segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných souborů .XML je třeba použít dotazovací jazyk XPath. Pro referenci viz výše uvedený příklad. Výraz XPath definuje elementy, ve kterých se má text/hodnota překládat, a nikoli skutečný textový uzel.

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //tu

  • Elementy obsahující zdrojový text

    tuv[@lang='en']/seg (ve vztahu k nadřazenému elementu //tu)

  • Elementy obsahující cílový text

    tuv[@lang='de']/seg (ve vztahu k elementu paContext Note rent //tu)

  • Elementy obsahující cílový text

    tuv[@lang='fr']/seg (ve vztahu k nadřazenému elementu //tu)

  • Nepřeložitelné inline elementy

    Všechny elementy ve zdrojovém nebo cílovém segmentu jsou považovány za inline elementy určené k překladu, pokud zde nejsou uvedeny jako inline elementy neurčené k překladu.

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy pro převod vybraného textu na tagy.

  • Kontextový klíč

    Zadejte kontextový klíč, který se uloží společně se segmentem do překladové paměti a použije se pro kontext shod.

  • Kontextová poznámka

    Importujte elementy nebo kontextové atributy pro každý element.

  • Max. délka cílového segmentu

    Importovat elementy nebo maximální délku cílového segmentu pro každý element

  • Převést na znakové entity

    Do vyexportovaného souboru zadejte seznam referenčních znaků (oddělených čárkami).

    Příklad:

    Pokud jsou vyžadovány uvozovky (), budou reprezentovány jako , znak Σ jako Σ použití Σ . & a < budou vždy reprezentovány jako & respektive <.

  • Analyzovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Použít podfiltr HTML 

    Importuje HTML tagy obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML. Tagy odstavce <p> vytvoří nové segmenty i v případě, že není vybrána možnost Segmentovat vícejazyčné XML.

  • Segmentovat vícejazyčné XML

    Text je segmentován obecným pravidlem pro segmentaci, nikoli jedním segmentem na buňku.

    Opatrnost

    Použití vícejazyčného XML segmentu na soubor obsahující cílový text může vést k jinému počtu segmentů ve zdrojovém textu než v cílovém.

  • Nastavit stav segmentů s neprázdným cílem 

    Vyberte výchozí stav potvrzení a zda se potvrzené segmenty automaticky přidávají do TM.

Příklad:

Pokud vícejazyčný .XML obsahuje obor názvů, může být XPath následující:

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //*[local-name()='trans-unit']

  • Elementy obsahující zdrojový text

    *[local-name()='source']

  • Elementy obsahující cílový text

    *[local-name()='target']

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.