Formát souboru .XML není určen k překladu a pro úspěšný import vyžaduje další nastavení.
Výchozí nastavení je označeno hvězdičkou (*) a import se všechny elementy XML k překladu. Možnostmi importu lze změnit chování importu.
Chatboti umělé inteligence mohou být velmi efektivní při identifikaci problémů s formátem souborů založených na .XML.
Typy souborů
-
.XML
Možnosti importu
Prostá pravidla importu
-
Importovány jsou pouze vybrané elementy (tedy název, název, odstavec). Hvězdička ( ) naimportuje všechny elementy.
-
Importovány jsou pouze vybrané atributy (tj. název, název, odstavec). Hvězdička ( ) importuje všechny atributy.
-
Pokud je vybrána možnost inline elementy překládaného textu.
, importují se všechny elementy v překládaném textu jako -
Vybraný název, název řádkového elementu bude převeden na tagy a obsah nebude překládán textem.
-
Elementy sousedící s textovými uzly budou automaticky převedeny na tagy na řádku.
-
Vybraný kód elementu se zpracuje jako .HTML.. Pro tyto elementy lze použít nastavení importu HTML, jako je Zachovat bílé znaky nebo Break tag (<br/>), které vytvoří nový segment.
Použijte tuto možnost, pokud vybraná hodnota elementu obsahuje značku .HTML. Neplatí pro podřízené vybraného elementu, pokud není uvedeno jinak.
-
Vybrané elementy budou naimportovány jako zamknuto.
-
Vybrané atributy budou naimportovány jako zamknuto.
-
ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.
-
XML entity v DTD deklaraci budou naimportovány k překladu.
-
Odznačte, pokud segmentace není žádoucí.
-
Komentáře se neimportují, pokud jsou elementy zpracovány jako HTML, jak je uvedeno v volbě Elementy (zpracovány jako HTML).
-
Použijte regulární výrazy a převeďte zadaný text na tagy.
-
Do výstupu souboru zadejte seznam číselných znaků (oddělených čárkami).
Příklad:
Nastavení XML pomocí XPath
Používání jazyka dotazů XPath umožňuje vytvářet složitá pravidla importu a některé další funkce, které pravidla prostého importu nedodávají.
XPath výraz by měl definovat elementy a/nebo atributy, jejichž text/hodnota by se měla přeložit, a nikoli skutečný textový uzel.
Před použitím doporučujeme seznámení s XPath.
, a nebudou zpracovány u souborů obsahujících více než 10 000 elementů XML.
-
Případně tvoří kontext TM (101% shody).
-
Import elementů nebo atributů kontextu pro každý element.
-
Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu v editoru. Znaky překračující limit jsou zvýrazněny červeně.
-
Prázdné pole - zachovat bílé znaky v elementech. Použijte xml:whitespace='preserve'. //*, aby byly zachovány všechny bílé znaky ve všech elementech, nebo použijte odpovídající výraz pro filtr XPath.
Náhled HTML se stylistikou XSLT
Jazyk XSLT (Extensible Stylesheet Language Transformations) lze použít k transformaci dokumentů .XML do formátu .HTML pro účely kontextového náhledu. Soubory s náhledem stažené prostřednictvím překladu náhledu v nabídce Dokument mají proto příponu HTML. Phrase aktuálně podporuje XSLT 2.0.
Pro import šablony stylů klikněte na tlačítko Vybrat soubor.
Kliknutím na tlačítko Stáhnout XSLT si stáhnete stylistiku po importu souboru.
CDATA v souboru XML
CDATA znamená data znaků a je definována jako bloky textu, které analyzátor nezpracovává, ale jsou rozpoznány jako značky. Předdefinované entity jako <,
>
a &
vyžadují psaní a obecně jsou ve značkách obtížně čitelné. V takových případech lze použít oddíl CDATA.
Pokud CDATA obsahuje vložený .HTML, měly by být odpovídající XML elementy uvedeny v sekci
.Pokud zdrojový soubor obsahuje CDATA a je použit
, pak se CDATA přidá ke každému segmentu v Dokončeném souboru.CDATA bude segmentována pouze v případě, že bude vymazat označení zalomení segmentu, jako je interpunkce nebo mezery.
Zdroj:
<text><![CDATA[Překládaný text text A. Překládaný text B.]]></text>
Cíl:
<text><![CDATA[Přeložitelný text A.]]><![CDATA[ ]]><![CDATA[Přeložitelný text B.]]></text>
Dokončený soubor je platný ve formátu .XML a prohlížeč XML zobrazí text správně jako překládaný text A. Překládaný text B.
Vícejazyčné soubory jsou importovány jako vícejazyčné zakázky s jazyky namapovanými před importem. V tabulce zakázek jsou zastoupeny souborem . Pokud je soubor importován do několika jazyků cíle, skládá se Dokončený soubor ze všech jazyků cíle.
Phrase podporuje soubory XML, které mají ve všech odstavcích elementy zdroje i cíle, i když je cíl prázdný. Pokud se segmentace zdroje a cíle liší, rozhoduje segmentace zdroje.
Jednotlivé elementy jazyka musí být potomky jednoho elementu trans-jednotky a jeden jazyk nesmí být obsažen v druhém. zdroj a cíl obsah nelze ukládat do hodnot atributů. Při shodě více elementů s XPath pro zdroj nebo cíl uvnitř elementu trans-jednotka se k překladu importuje pouze první z nich.
-
Při vytváření zakázky vyberte před použitím možností importu v podokně . Není-li určeno, soubor se naimportuje jako standardní .XML.
-
Obsah tagů zdrojového souboru .XML lze zobrazit v editoru kliknutím na tlačítko Rozbalit tagy v nabídce a upravit kliknutím na F2.
Příklad:
Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">
, <tuv lang="de">
a <tuv lang="fr">
jsou potomky stejného elementu <tu>
.
<?xml version="1.0" encoding="utf-8"?> <root> Text nelze překládat textem. <tu note="Kontextová poznámka" klíč="ID 254" maxlen="16"> <tuv lang="cs"> <seg>První segment.</seg> </tuv> <tuv lang="de"> <seg>Erste segment</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu note="jiná kontextová poznámka" klíč="ID 255" maxlen="18"> <tuv lang="cs"> <seg>Druhý segment.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Možnosti importu
Pro import vícejazyčných souborů .XML se musí použít jazyk dotazu XPath. Reference viz výše uvedený příklad. Výraz XPath definuje elementy, ve kterých se má text/hodnota přeložit, a nikoli skutečný textový uzel.
-
//tu
-
tuv[@lang='cs']/seg
(ve vztahu k hlavnímu elementu//tu
) -
tuv[@lang='de']/seg
(ve vztahu k prvku pa rent//tu
) -
tuv[@lang='fr']/seg
(ve vztahu k hlavnímu elementu//tu
) -
Všechny elementy ve zdroji nebo cíli jsou považovány za inline elementy překládaného textu, pokud zde nejsou uvedeny jako inline elementy nepřekládaného textu.
-
Použijte regulární výrazy a převeďte zadaný text na tagy.
-
Určete kontextový klíč, který se uloží se segmentem do překladové paměti a použije se pro kontext shod.
-
Import elementů nebo atributů kontextu pro každý element.
-
Import elementů nebo maximální délka cíle pro každý element
-
Do výstupu souboru zadejte seznam číselných znaků (oddělených čárkami).
Příklad:
-
ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.
-
Importuje HTML tagy obsažené v souboru. Tagy pak lze použít v nastavení importu HTML souboru. Odstavcové tagy
<p>
vytvoří nové segmenty, i když není vybrán . -
Text je segmentován obecným pravidlem segmentace, nikoli jedním segmentem na buňku.
Pozor
Použití
na soubor, který obsahuje text cíle, může vést k jinému počtu segmentů ve zdroji než v cíli. -
Vyberte výchozí stav potvrzení a zda se potvrzeno segmenty automaticky přidávají do TM.
Příklad: