Formát souboru .XML není určen k překladu a pro úspěšný import vyžaduje další nastavení.
Výchozí nastavení je označeno hvězdičkou (*) a importuje všechny elementy XML k překladu. Možnosti import lze použít ke změnit chování import.
Chatboti umělé inteligence mohou být velmi efektivní při identifikaci problémů s formátem souborů založených na .XML.
Typy souborů
-
.XML
Možnosti importu
Prostá pravidla importu
-
Importovány budou pouze vybrané elementy (tj. název, název, odstavec). Hvězdička ( ) importuje všechny elementy.
-
Importovány budou pouze vybrané atributy (tj. název, název, odstavec). Hvězdička ( ) importuje všechny atributy.
-
Pokud je vybrána možnost překládané inline elementy.
, importují se všechny elementy v překládaném textu jako -
Vybraný název, název řádkového elementu bude převeden na tagy a obsah nebude překládán textem.
-
Elementy sousedící s textovými uzly budou automaticky převedeny na tags na řádku.
-
Vybraný kód elementu se zpracuje jako .HTML. Pro tyto elementy lze použít nastavení importu .HTML, jako je Zachovat bílé znaky nebo Break tag (<br/>), které vytvoří nový segment.
Použijte tuto možnost, pokud vybraná hodnota elementu obsahuje značku .HTML. Pokud není uvedeno jinak, neplatí to pro potomky vybraného elementu.
-
Vybrané elementy budou naimportovány jako zamknuto.
-
Vybrané atributy budou naimportovány jako zamknuto.
-
ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.
-
XML entity v DTD deklaraci budou naimportovány k překladu.
-
Zrušte výběr, pokud segmentace není žádoucí.
-
Komentáře nejsou naimportovány, pokud jsou elementy zpracovány jako HTML, jak je uvedeno v volbě Elementy (zpracovány jako HTML).
-
Použijte regulární výrazy a převeďte zadaný text na tagy.
-
Do výstupu souboru zadejte seznam odkazů na znaky (oddělený čárkami).
Příklad:
Nastavení XML pomocí XPath
Použití jazyka dotazů XPath umožňuje vytvořit složitá pravidla importu a některé další funkce, které nejsou v pravidlech prostého importu k dispozici.
Výraz XPath by měl definovat elementy a/nebo atributy, jejichž text/hodnota by se měla přeložit, a nikoli skutečný textový uzel.
Před použitím doporučujeme seznámit se s XPath.
, a nebudou zpracovány u souborů s více než 10 000 elementy XML.
-
V relevantním případě představuje kontext TM (101% shody).
-
Import elementů nebo kontextových atributů pro každý element.
-
Import elementů nebo maximální délka cíle pro každý element. Limit počtu znaků pro každý segment se zobrazí na panelu v editoru. Všechny znaky překračující limit jsou zvýrazněny červeně.
-
empty pole - zachovat bílé znaky v elementech. Použijte xml:whitespace='preserve'. //* aby byly zachovány všechny bílé znaky ve všech elementech, nebo použijte odpovídající výraz pro filtr XPath.
Náhled HTML se stylistikou XSLT
Jazyk XSLT (rozšiřitelné prvky formátu Transjazyk stylistiky) lze použít k transformaci dokumentů .XML do formátu .HTML pro účely náhledu v kontextu. Náhled souborů stažených prostřednictvím Náhledu překladu v nabídce Dokumenty je proto dodáván s příponou HTML. Phrase aktuálně podporuje XSLT 2.0.
Pro import stylistiky klikněte na Vybrat soubor.
Kliknutím na tlačítko Stáhnout XSLT si po importu souboru stáhněte stylistiku.
CDATA v souboru XML
CDATA znamená Data znaků a je definována jako bloky textu, které parser nezpracovává, ale rozpoznává je jako značky. Předdefinované entity jako <,
>
a &
vyžadují přepisování a ve značkách jsou obecně obtížně čitelné. V takových případech lze použít oddíl CDATA.
Pokud CDATA obsahuje vložený .HTML, měly by být odpovídající elementy XML uvedeny v části
.Pokud soubor zdroje obsahuje CDATA a je použit
, přidá se CDATA ke každému segmentu v Dokončeném souboru.CDATA bude segmentována pouze v případě, že bude vymazat označení zalomení segmentu, jako je interpunkce nebo mezery.
Zdroj:
<text><![CDATA[Překládaný text text A. Překládaný text B.]]></text>
Cíl:
<text><![CDATA[Přeložitelný text A.]]><![CDATA[ ]]><![CDATA[Přeložitelný text B.]></text>
Dokončený soubor je platný .XML a prohlížeč XML zobrazí text správně jako překládaný text A. Překládaný text B.
Vícejazyčné soubory jsou importovány jako vícejazyčné zakázky s jazyky namapovanými před importem. V tabulce zakázek jsou zastoupeny . Při importu do několika jazyků cíle se dokončený soubor skládá ze všech jazyků cíle.
phrase podporuje soubory XML, které mají zdroj i cíl elementy přítomné ve všech odstavcích, i když je cíl empty. Pokud je segmentace zdroje a cíle odlišná, je určující segmentace zdroje.
Jednotlivé elementy jazyka musí být potomky jednoho elementu trans-jednotky a jeden jazyk nesmí být obsažen v druhém. zdroj a cíl obsah nelze ukládat do hodnot atributů. Dojde-li ke shodě více elementů s XPath pro zdroj nebo cíl v elementu trans-unit, importuje se k překladu pouze první z nich.
-
Při vytváření zakázky vyberte před použitím Možností importu z podokna . Pokud není zadáno, importuje se soubor jako standardní .XML.
-
Obsah tagů zdrojového souboru .XML lze zobrazit v editoru kliknutím na tlačítko Expand tags v nabídce a upravit kliknutím na položku F2.
Příklad:
Ukázka částečně přeloženého textu z angličtiny do němčiny a francouzštiny. Všechny <tuv lang="en">
, <tuv lang="de">
a <tuv lang="fr">
jsou potomky stejného elementu <tu>
.
<?xml version="1.0" encoding="utf-8"?> <root> Nepřekládaný text. <tu note="context note" key="ID 254" maxlen="16"> <tuv lang="en"> <seg>První segment.</seg> </tuv> <tuv lang="de"> <seg>Erste segment</seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> <tu note="another context note" key="ID 255" maxlen="18"> <tuv lang="en"> <seg>Druhý segment.</seg> </tuv> <tuv lang="de"> <seg></seg> </tuv> <tuv lang="fr"> <seg></seg> </tuv> </tu> </root>
Možnosti importu
Pro import vícejazyčných souborů .XML se musí použít jazyk dotazu XPath. Reference viz výše uvedený příklad. Výraz XPath definuje elementy, ve kterých se má text/hodnota překládat, a nikoli skutečný textový uzel.
-
//tu
-
tuv[@lang='cs']/seg
(ve vztahu k hlavnímu elementu//tu
) -
tuv[@lang='de']/seg
(ve vztahu k prvku pa rent//tu
) -
tuv[@lang='fr']/seg
(ve vztahu k hlavnímu elementu//tu
) -
Všechny elementy ve zdroji nebo cíli jsou považovány za inline elementy určené k překládanému textu, pokud zde nejsou uvedeny jako inline elementy určené k nepřekládanému textu.
-
Použijte regulární výrazy a převeďte zadaný text na tagy.
-
Určete kontextový klíč, který se společně se segmentem uloží do překladové paměti a použije se pro kontext shod.
-
Import elementů nebo kontextových atributů pro každý element.
-
Import elementů nebo maximální délka cíle pro každý element
-
Do výstupu souboru zadejte seznam odkazů na znaky (oddělený čárkami).
Příklad:
-
ICU zprávy jsou automaticky převedeny na tagy. Soubory s ICU nesmí obsahovat žádné inline elementy.
-
Importuje tagy HTML obsažené v souboru. Tagy pak lze použít v nastavení importu souborů HTML. Tagy odstavců
<p>
vytvoří nové segmenty i v případě, že není vybrána možnost . -
Text je segmentován obecným pravidlem segmentace, nikoli jedním segmentem na buňku.
Pozor
Použití
na soubor obsahující text cíle může vést k jinému počtu segmentů ve zdroji než v cíli. -
Vyberte výchozí stav potvrzení a zda se potvrzeno segmenty automaticky přidávají do TM.
Příklad: