Nastavení importu souborů

.XML - Extensible Markup Language (TMS)

Obsah je strojově přeložen z angličtiny s použitím Phrase Language AI.

Formát souboru .XML není navržen pro překlad a vyžaduje další nastavení pro úspěšný import.

Výchozí nastavení jsou označena hvězdičkou (*) a importují všechny XML prvky k překladu. Možnosti importu lze použít k změně chování importu.

Služby AI mohou být velmi efektivní při identifikaci problémů s formátem v souborech založených na .XML.

Typy souborů

  • .XML

Možnosti importu

Pravidla pro běžný import

  • Elementy

    Pouze vybrané prvky (např. název, titulek, odstavec) jsou importovány. Hvězdička (*) importuje všechny prvky.

  • Atributy

    Pouze vybrané atributy (např. název, titulek, odstavec) jsou importovány. Hvězdička (*) importuje všechny atributy.

  • Řádkové elementy určené k překladu

    Pokud je vybrána možnost Automaticky identifikovat řádkové prvky, všechny prvky v překládaném textu jsou importovány jako Překládané řádkové prvky.

  • Řádkové elementy neurčené k překladu

    Vybraný řádkový prvek název, titulek, odstavec bude převeden na tagy a obsah nebude překládatelný.

    Důležité

    Problémy s tagy jsou běžnou příčinou chyb při exportu (např. Soubor se nepodařilo vygenerovat), zejména pro typy souborů jako tabulky (na bázi MS Excel) a .XML. Vždy se ujistěte, že tagy a formátování jsou správné před exportem souborů provedením kontrol kontroly kvality.

  • Automaticky rozpoznat inline elementy

    Prvky, které jsou sousedy textových uzlů, budou automaticky převedeny na řádkové tagy.

  • Elementy (zpracované jako HTML)

    Vybraný kód prvku je zpracován jako .HTML. Nastavení importu .HTML jako Zachovat bílé znaky nebo Tag pro zlomení (<br/>) vytváří nový segment lze použít pro tyto prvky.

    Použijte tuto možnost, když hodnota vybraného prvku obsahuje .HTML značkování. Nepoužívá se na děti vybraného prvku, pokud není uvedeno jinak.

  • Zamknuté elementy

    Vybrané prvky budou importovány jako Zamknuto.

  • Zamknuté atributy

    Vybrané atributy budou importovány jako Zamknuto.

  • Extrahovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Importovat XML entity

    XML entity v DTD deklaraci budou importovány k překladu.

  • Segmentovat XML

    Zrušte zaškrtnutí, pokud segmentace není žádoucí.

  • Importovat komentáře

    Komentáře nejsou importovány, pokud jsou prvky zpracovány jako HTML, jak je uvedeno v možnosti Prvky (zpracovány jako HTML).

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy a převeďte zadaný text na tagy.

  • Převést na znakové entity

    Zadejte seznam znakových referencí (oddělených čárkami) do výstupního souboru.

    Příklad:

    Pokud jsou požadovány uvozovky ("), budou reprezentovány jako &quot;, znak Σ bude reprezentován jako &#x3A3; použijte &quot;,&#x3A3;. & a < jsou vždy exportovány jako &amp; a &lt; odpovídajícím způsobem.

XML nastavení pomocí XPath

Použití jazyka XPath pro dotazy umožňuje vytváření složitých pravidel importu a některé další funkce, které nejsou k dispozici v běžných pravidlech importu.

Výraz XPath by měl definovat prvky a/nebo atributy, jejichž text/hodnota by měly být přeloženy, a ne skutečný textový uzel.

Doporučuje se znalost XPath před použitím.

Kontextová poznámka, kontextový klíč a Max. cílová délka nebudou zpracovány pro soubory s více než 10 000 XML prvky.

  • Kontextový klíč

    V relevantním případě představuje kontext TM (101% shody).

  • Kontextová poznámka

    Importujte prvky nebo kontextové atributy pro každý prvek.

  • Max. délka cílového segmentu

    Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu Kontextových poznámek v editoru. Všechny znaky překračující limit jsou zvýrazněny červeně.

  • Zachovat bílé znaky

    Nechte prázdné pro zachování mezer v prvcích. Použijte xml:whitespace='preserve'. //* pro zachování všech mezer ve všech prvcích, nebo použijte libovolný výraz XPath.

HTML náhled s XSLT stylovým listem

Jazyk XSLT (Extensible Stylesheet Language Transformations) může být použit k transformaci .XML dokumentů do .HTML formátu pro náhled v kontextu účely. Podle toho, náhledové soubory stažené prostřednictvím Náhled překladu v menu Dokument přicházejí s HTML příponou. Phrase aktuálně podporuje XSLT 2.0.

XSLT používané pro náhled musí být založeno na cíli, nikoli na zdroji.

Klikněte na Vybrat soubor pro import stylového listu.

Klikněte na Stáhnout XSLT pro stažení stylového listu po importu souboru.

CDATA v XML souboru

CDATA znamená Character Data a je definováno jako bloky textu, které nejsou zpracovávány parserem, ale jsou rozpoznávány jako značkování. Předdefinované entity jako &lt;, &gt; a &amp; vyžadují psaní a obecně se obtížně čtou ve značkování. V takových případech lze použít sekci CDATA.

Pokud CDATA obsahuje vložené .HTML, měly by být odpovídající XML prvky uvedeny pod Prvky (zpracovány jako HTML).

Pokud zdrojový soubor obsahuje CDATA a je použit Segment XML, pak je CDATA přidáno ke každému segmentu ve dokončeném souboru.

CDATA bude segmentováno pouze v případě, že existuje jasná indikace přerušení segmentu, jako je interpunkce nebo mezera.

Zdroj:

<text><![CDATA[Překládaný text A. Překládaný text B.]]></text>

Cíl:

<text><![CDATA[Překládaný text A.]]><![CDATA[ ]]><![CDATA[Překládaný text B.]]></text>

Dokončený soubor je platný .XML a XML prohlížeč zobrazí text správně jako Překládaný text A. Překládaný text B.

Specifická nastavení aplikace

Wordpress XML

Doporučená nastavení pro Wordpress XML:

  • XML

    XPath

  • Elementy a atributy

    //*[local-name()='encoded']|//description|//title

  • Elementy (zpracované jako HTML)

    //*[local-name()='encoded']|//description|//title

  • Převést na tagy programu Phrase

    (\[[^\]]++\])++

Vyberte Zachovat bílé znaky v HTML nastaveních.

Vícejazyčný XML

Vícejazyčné soubory jsou importovány jako více dvojjazyčných úloh s jazyky mapovanými před importem. Jsou reprezentovány jako multilingual_xml.png v tabulce úloh. Pokud jsou importovány do několika cílových jazyků, Dokončeno soubor se skládá ze všech cílových jazyků.

Phrase podporuje XML soubory, které mají přítomny jak zdrojové, tak cílové prvky pro všechny odstavce, i když je cíl prázdný. Když se zdrojová a cílová segmentace liší, určuje zdrojová segmentace.

Jednotlivé jazykové prvky musí být všechny potomky stejného trans-unit prvku a jeden jazyk nemůže být obsažen v druhém. Obsah zdroje a cíle nemůže být uložen v hodnotách atributů. Pokud více prvků odpovídá XPath pro zdroj nebo cíl uvnitř trans-unit prvku, pouze první je importován k překladu.

  • Při vytváření zakázka vyberte Vícejazyčný XML z panelu Typ souboru před použitím možností importu. Pokud není specifikováno, soubor bude importován jako standardní .XML.

  • Obsah tagu zdrojového .XML souboru může být vizualizován v editoru kliknutím na Rozbalit tagy v nabídce Nástroj a upraven kliknutím na F2.

Příklad:

Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného <tu> prvku.

<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřekládaný text.
<tu note="context note" key="ID 254" maxlen="16"> 
  <tuv lang="en">
    <seg>První segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg>Erste segment</seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
<tu note="another context note" key="ID 255" maxlen="18"> 
  <tuv lang="en">
    <seg>Druhý segment.</seg>
  </tuv>
  <tuv lang="de">
    <seg></seg>
  </tuv>
  <tuv lang="fr">
    <seg></seg>
  </tuv>
</tu>
</root>

Možnosti importu

Pro import vícejazyčných .XML souborů musí být použita XPath dotazovací jazyk. Viz příklad výše pro reference. Výraz XPath definuje prvky, ve kterých by měl být text/hodnota přeložena, a nikoli skutečný textový uzel.

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //tu

  • Elementy obsahující zdrojový text

    tuv[@lang='en']/seg (ve vztahu k hlavnímu prvku //tu)

  • Elementy obsahující cílový text

    tuv[@lang='de']/seg (ve vztahu k kontextové poznámce hlavnímu prvku //tu)

  • Elementy obsahující cílový text

    tuv[@lang='fr']/seg (ve vztahu k hlavnímu prvku //tu)

  • Řádkové elementy neurčené k překladu

    Všechny prvky ve zdroji nebo cíli jsou považovány za překládané inline prvky, pokud zde nejsou specifikovány jako nepřekládané inline prvky.

  • Převést na tagy Phrase TMS 

    Použijte regulární výrazy a převeďte zadaný text na tagy.

  • Kontextový klíč

    Specifikujte kontextový klíč, který je uložen se segmentem do překladové paměti a používá se pro kontext shody.

  • kontextová poznámka

    Importujte prvky nebo kontextové atributy pro každý prvek.

  • Max. délka cílového segmentu

    Importujte prvky nebo maximální cílovou délku pro každý prvek

  • Převést na znakové entity

    Zadejte seznam znakových referencí (oddělených čárkami) do výstupního souboru.

    Příklad:

    Pokud jsou požadovány uvozovky ("), budou reprezentovány jako &quot;, znak Σ bude reprezentován jako &#x3A3; použijte &quot;,&#x3A3;. & a < jsou vždy exportovány jako &amp; a &lt; odpovídajícím způsobem.

  • Extrahovat zprávy ICU

    ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.

  • Použít podfiltr HTML 

    Importuje tagy HTML obsažené v souboru. Tagy mohou být poté použity s nastavením importu HTML souboru. Odstavcové tagy <p> vytvoří nové segmenty, i když Segment vícejazyčný XML není vybrán.

  • Segmentovat vícejazyčné XML

    Text je segmentován podle obecného pravidla segmentace spíše než jednoho segmentu na buňku.

    Pozor

    Použití Segment vícejazyčný XML na soubor, který obsahuje cílový text, může vést k jinému počtu segmentů ve zdroji než v cíli.

  • Nastavit stav segmentů s neprázdným cílem 

    Vyberte výchozí stav potvrzení a zda jsou potvrzené segmenty automaticky přidávány do TM.

Příklad:

Pokud vícejazyčný .XML obsahuje prostor názvů, XPath by mohl být následující:

  • Elementy obsahující dílčí elementy na straně zdrojového a cílového textu

    //*[local-name()='trans-unit']

  • Elementy obsahující zdrojový text

    *[local-name()='source']

  • Elementy obsahující cílový text

    *[local-name()='target']

Byl pro vás tento článek užitečný?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.