Formát souboru .XML není navržen pro překlad a vyžaduje další nastavení pro úspěšný import.
Výchozí nastavení jsou označena hvězdičkou (*) a importují všechny XML prvky k překladu. Možnosti importu lze použít ke změně chování importu.
Služby AI mohou být velmi efektivní při identifikaci problémů s formátem v souborech založených na .XML.
Typy souborů
-
.XML
Možnosti importu
Pravidla pro běžný import
-
Importovány jsou pouze vybrané prvky (tj. název, titulek, odstavec). Hvězdička () importuje všechny prvky.
-
Importovány jsou pouze vybrané atributy (tj. název, titulek, odstavec). Hvězdička () importuje všechny atributy.
-
Pokud je vybrána možnost , všechny prvky v překládaném textu jsou importovány jako Překládané řádkové prvky.
-
Vybraný řádkový prvek název, titulek, odstavec bude převeden na tagy a obsah nebude překládaný.
Důležité
Problémy s tagy jsou běžnou příčinou chyb při exportu (např. ), zejména pro typy souborů jako tabulky (na bázi MS Excel) a .XML. Vždy se ujistěte, že tagy a formátování jsou správné před exportem souborů provedením kontrol kontroly kvality .
-
Prvky, které jsou sousedy textových uzlů, budou automaticky převedeny na řádkové tagy.
-
Vybraný kód prvku je zpracován jako .HTML. Nastavení importu .HTML jako Zachovat bílé znaky nebo Tag pro zlomení (<br/>) vytváří nový segment lze použít pro tyto prvky.
Použijte tuto možnost, když hodnota vybraného prvku obsahuje .HTML značkování. Nepoužívá se na děti vybraného prvku, pokud není uvedeno jinak.
-
Vybrané prvky budou importovány jako Zamknuto.
-
Vybrané atributy budou importovány jako Zamknuto.
-
Zadejte seznam odkazů na znaky (oddělených čárkami) do výstupního souboru.
Příklad:
-
Použijte regulární výrazy a převeďte zadaný text na tagy.
-
ICU zprávy jsou automaticky převedeny na tagy. Když segment obsahuje inline prvky, ICU analýza pro tento segment je přeskočena. Segmenty bez inline prvků jsou analyzovány normálně.
-
XML entity v DTD Declaration budou importovány k překladu.
-
-
Komentáře nejsou importovány, pokud jsou prvky zpracovány jako HTML, jak je uvedeno v možnosti Elements (processed as HTML).
-
Vyberte, abyste zabránili segmentaci uvnitř XML párových značek nebo podprvků. To je užitečné, pokud XML obsahuje vnořené struktury, kde by segmentace narušila logický význam textu.
-
.XSL stylový list může být nahrán a z něj může být vygenerován čitelný náhledový soubor.
XML nastavení pomocí XPath
Použití jazyka dotazování XPath umožňuje vytváření složitých pravidel importu a některých dalších funkcí, které nejsou k dispozici v běžných pravidlech importu.
Výraz XPath by měl definovat prvky a/nebo atributy, jejichž text/hodnota by měly být přeloženy, a ne skutečný textový uzel.
Doporučuje se znalost XPath před použitím.
, a nebudou zpracovány pro soubory s více než 10 000 XML prvky.
-
V relevantním případě představuje kontext TM (101% shody).
-
Importujte prvky nebo kontextové atributy pro každý prvek.
-
Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu v editoru. Všechny znaky překračující limit jsou zvýrazněny červeně.
-
Nechte prázdné, abyste zachovali bílé znaky v prvcích. Použijte xml:whitespace='preserve'. //*, abyste zachovali všechny bílé znaky ve všech prvcích, nebo použijte libovolný výraz XPath.
-
Určete XML prvky nebo atributy, které by neměly být segmentovány. Zadejte výraz XPath, který identifikuje uzly, které mají být vyloučeny. Jakýkoli text extrahovaný z těchto uzlů bude zachován jako jeden segment, spíše než rozdělen na menší jednotky.
Zadejte //element[@attr='value'] pro vyloučení všech
<element>uzlů, které obsahují atributattr="value"z segmentace.
HTML náhled s XSLT stylovým listem
XSLT jazyk (Extensible Stylesheet Language Transformations) může být použit k transformaci .XML dokumentů do .HTML formátu pro náhled v kontextu účely. Podle toho, náhledové soubory stažené přes náhled překladu v menu dokument přicházejí s HTML příponou. Phrase aktuálně podporuje XSLT 2.0.
XSLT použitý pro náhled musí být založen na cíli, nikoli na zdroji.
Klikněte na Vybrat soubor pro import stylového listu.
Klikněte na Stáhnout XSLT pro stažení stylového listu po importu souboru.
CDATA v XML souboru
CDATA znamená znaková data a je definováno jako bloky textu, které nejsou zpracovány parserem, ale jsou rozpoznány jako značkování. Předdefinované entity jako <, >, a & vyžadují psaní a obecně se obtížně čtou ve značkování. V takových případech může být použita sekce CDATA.
Pokud CDATA obsahuje vložené .HTML, odpovídající XML prvky by měly být uvedeny pod .
Pokud zdrojový soubor obsahuje CDATA a je použit, pak je CDATA přidáno do každého segmentu v dokončeném souboru.
CDATA bude segmentováno pouze pokud existuje jasná indikace segmentového zlomu, jako je interpunkce nebo mezera.
Zdroj:
<text><![CDATA[Text k překladu A. Text k překladu B.]]></text>
Cíl:
<text><![CDATA[Text k překladu A.]]><![CDATA[ ]]><![CDATA[Text k překladu B.]]></text>
Dokončený soubor je platný .XML a XML prohlížeč zobrazí text správně jako Text k překladu A. Text k překladu B.
Vícejazyčné soubory jsou importovány jako více dvojjazyčných zakázek s jazyky mapovanými před importem. Jsou reprezentovány jako v tabulce zakázky. Pokud jsou importovány do několika cílových jazyků, Dokončeno soubor se skládá ze všech cílových jazyků.
Phrase podporuje XML soubory, které mají přítomné jak zdrojové, tak cílové prvky pro všechny odstavce, i když je cíl prázdný. Když se zdrojová a cílová segmentace liší, určuje zdrojová segmentace.
Jednotlivé jazykové prvky musí být všechny potomky stejného trans-unit prvku a jeden jazyk nemůže být obsažen v druhém. Obsah zdroje a cíle nemůže být uložen v hodnotách atributů. Pokud více prvků odpovídá XPath pro zdroj nebo cíl uvnitř trans-unit prvku, pouze první je importován k překladu.
-
Při vytváření zakázky vyberte z panelu před použitím možností importu. Pokud není specifikováno, soubor bude importován jako standardní .XML.
-
Obsah tagu zdrojového .XML souboru může být vizualizován v editoru kliknutím na Rozšířit tagy v nabídce a upraven kliknutím na F2.
Příklad:
Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">, <tuv lang="de"> a <tuv lang="fr"> jsou potomky stejného <tu> prvku.
<?xml version="1.0" encoding="utf-8"?>
<root>
Nepřekládaný text.
<tu note="kontextová poznámka" key="ID 254" maxlen="16">
<tuv lang="en">
<seg>První segment.</seg>
</tuv>
<tuv lang="de">
<seg>Erste segment</seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
<tu note="další kontextová poznámka" key="ID 255" maxlen="18">
<tuv lang="en">
<seg>Druhý segment.</seg>
</tuv>
<tuv lang="de">
<seg></seg>
</tuv>
<tuv lang="fr">
<seg></seg>
</tuv>
</tu>
</root>
Možnosti importu
Pro import vícejazyčných .XML souborů musí být použit jazyk dotazu XPath. Viz příklad výše pro referenci. Výraz XPath definuje prvky, ve kterých by měl být text/hodnota přeložena, a nikoli skutečný textový uzel.
-
//tu -
tuv[@lang='cs']/seg(ve vztahu k hlavnímu prvku//tu) -
Všechny prvky ve zdroji nebo cíli jsou považovány za překládané inline prvky, pokud zde nejsou specifikovány jako nepřekládané inline prvky.
-
Specifikujte kontextový klíč, který je uložen se segmentem do překladové paměti a používá se pro kontext shody.
-
Importujte prvky nebo kontextové atributy pro každý prvek.
-
Import elementů nebo maximální délka cíle pro každý element
-
Zadejte seznam odkazů na znaky (oddělených čárkami) do výstupního souboru.
Příklad:
-
Použijte regulární výrazy a převeďte zadaný text na tagy.
-
ICU zprávy jsou automaticky převedeny na tagy. Když segment obsahuje inline prvky, ICU analýza pro tento segment je přeskočena. Segmenty bez inline prvků jsou analyzovány normálně.
-
Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu HTML souborů. Odstavcové značky
<p>vytvoří nové segmenty, i když není vybrán. -
Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu HTML souborů.
-
Text je segmentován podle obecného pravidla segmentace spíše než jednoho segmentu na buňku.
Pozor
Použití na soubor, který obsahuje cílový text, může vést k jinému počtu segmentů ve zdroji než v cíli.
-
Vyberte výchozí stav potvrzení a zda jsou potvrzené segmenty automaticky přidávány do TM.
-
.XSL stylový list může být nahrán a z něj může být vygenerován čitelný náhledový soubor.
Příklad: