Maschinelle Übersetzung

Maschinelle Übersetzung (TMS)

Inhalte werden von Phrase Language AI maschinell aus dem Englischen übersetzt.

Integrationen mit vielen Dienstleistern maschineller Übersetzung sind möglich. Es ist möglich, maschinelle Übersetzung mit Phrase Language AI zu verwenden oder direkte Verbindungen mit wie DeepL, Amazon Translate und Google Translate einzurichten.

Anwendungsfälle

Reine maschinelle Übersetzung

In Fällen, in denen keine perfekte Übersetzung erforderlich ist – beispielsweise in der internen Kommunikation – kann eine reine maschinelle Übersetzung verwendet werden. Je nach Qualität des Translation Memory kann auch reine maschinelle Übersetzung eine gewisse Qualität aufweisen. Bei der Vorübersetzung wird eine reine maschinelle Übersetzung erzeugt.

Post-Editing maschineller Übersetzungen (MTPE)

Eine hochwertigere Übersetzung erfordert die Überprüfung und Bearbeitung reiner maschineller Übersetzungen durch professionelleLinguisten. Ein Arbeitsablauf für Übersetzungen sollte die maschinelle Übersetzung, den Bearbeitungs- und Überprüfungsprozess sowie Benachrichtigungen von Management und Kunden umfassen. Post-Editing-Übersetzungsentscheidungen werden in Translation Memorys und Termbanken zur Wiederverwendung erfasst.

Engine-Einstellungen für maschinelle Übersetzung

Auf der Seite Engines für maschinelle Übersetzung wird die Tabelle Engine-Anwendungen angezeigt, Phrase Language AI kann konfiguriert werden und Engines für maschinelle Übersetzungen von Drittanbietern können hinzugefügt werden.

Gehe folgendermaßen vor, um auf die Engine-Einstellungen für maschinelle Übersetzung zuzugreifen:

  1. Scrolle auf der Seite Einstellungen Setup_gear.png nach unten zum Abschnitt Integrationen.

  2. Klicke auf Engines für maschinelle Übersetzung.

Zeichennutzung

Auf der Seite Engines für maschinelle Übersetzung ist ein Zeichennutzungsdiagramm für alle einem Profil zugeordneten MT-Engines dargestellt.

Die Nutzung von MT-Zeichen wird im Ausgangstext einschließlich Leerzeichen und bei Bestätigung von Segmenten ohne Alt-Trans (auf der Grundlage der Einstellungen) berechnet.

Daten für eine bestimmte Engine können angezeigt werden, indem die Namen der anderen Engines am unteren Rand des Diagramms abgewählt werden. Das Diagramm zeigt nur die Daten der letzten 30 Tage.

Standardmäßig können Projektmanager nur Daten zu von ihnen erstellten Projekten einsehen.

MT-Engines von Drittanbietern konfigurieren

Wenn Phrase Language AI nicht verwendet wird, kann über eine API auf maschinelle Übersetzungen von Drittanbietern zugegriffen werden. Wenn du MT von Drittanbietern in Phrase verwendest, stelle sicher, dass die Geschäftsbedingungen des jeweiligen MT-Dienstleisters gelesen und verstanden wurden. Einige MT Engines enthalten Restrictions (TMS).

Um eine neue Engine zur maschinellen Übersetzung festzulegen, muss ein Admin-User folgendermaßen vorgehen:

  1. Scrolle auf der Seite Einstellungen Setup_gear.png nach unten zum Abschnitt Integrationen.

  2. Klicke auf Engines für maschinelle Übersetzung.

    Die Seite Engines für maschinelle Übersetzung wird geöffnet.

  3. Klicke auf Erstellen

    Das Fenster Engine für maschinelle Übersetzung erstellen wird geöffnet.

  4. Wähle MT-Engine aus der Dropdown-Liste aus und klicke auf Erstellen.

    Die Seite Erstellen wird geöffnet.

  5. Fülle die erforderlichen Felder je nach MT-Engine-Typ aus.

  6. Wähle Optionen aus (nicht auf alle MT-Engine-Typen anwendbar)

    • Füge Labels hinzu (Key und Wert)

    • Tags einbeziehen

    • Als Standard festlegen

  7. Klicke auf Speichern.

    Die Engine wird in die Liste der Engines zur maschinellen Übersetzungen aufgenommen.

Einige Engines für maschinelle Übersetzung sind nicht für die Öffentlichkeit verwendbar, andere sind nur in bestimmten Ausgaben verfügbar.

MT-Datenbereinigung

Verfügbar für

  • Enterprise-Plan (Legacy)

Kontaktiere Vertrieb für Fragen zur Lizenzierung.

Rohdaten können gefiltert und aus Translation Memorys extrahiert werden, um sie über eine API zum Training benutzerdefinierter MT-Engines zu verwenden.

API-Dokumentation

Datenbereinigungsprozess:

  1. Rohdaten aus bestimmten Sprachpaaren werden aus Translation Memorys heruntergeladen.

  2. Die Daten werden gefiltert.

    Segmente mit derselben Ausgangssprache und Zielsprache werden zusammen mit Tags verworfen und Daten dedupliziert.

    Bei CJK-Sprachen ist das Filtern lockerer.

  3. 10 % der Daten mit der geringsten semantischen Ähnlichkeit zwischen Ausgangssprache und Zielsprache werden entfernt.

    Das Verhältnis der verworfenen Daten kann mit preserveRatio definiert werden.

  4. Die Daten werden je nach outputFormat in TXT/TSV konvertiert.

Bereinigungskriterien:

  • Minimale/maximale Länge

    Jedes Segment benötigt mindestens 5 Zeichen und mindestens 3 Buchstaben in jedem Alphabet/in jeder Schrift. Das Segment muss kürzer als 1.000 Zeichen sein. Nicht übereinstimmende Segmente werden verworfen

  • Längenverhältnis

    Sprachenspezifisch.

    Das Verhältnis von Ausgangssegmentlänge zu Zielsegmentlänge (und umgekehrt) darf nicht größer als 2 sein.

    Beispiel:

    Wenn das Segment in der Ausgangssprache 30 Zeichen und die Zielsprache 70 Zeichen umfasst, wird das Segmentpaar verworfen.

  • LASER-Kennzahl

    Segmente, die die ersten Prüfungen bestanden haben, werden mit Hilfe der LASER-Metriken mit Kennzahlen versehen und sortiert; Segmentpaare mit Kennzahlen von mehr als 90 % werden beibehalten. LASER erkennt automatisch, ob sich Sätze in zwei verschiedenen Sprachen ähneln. Diese Prüfung richtet sich hauptsächlich an falsch ausgerichtete/verrauschte TM-Einträge.

Unterstützte Drittanbieter-Engines für maschinelle Übersetzung

  • Alexa Translations A.I. (ehemals Yappn)

  • Amazon Translate

  • Apertium

  • Closed NMT

  • CrossLang

  • DeepL Free, DeepL Pro Advanced und DeepL Pro Ultimate (wende dich an den Support von DeepL für einen API v1 Key für CAT Tools)

  • Fair Trade Translation

  • Globalese

  • Globalese NMT (Neuronale maschinelle Übersetzung)

  • Google AutoML

    Notiz

    Beim Hinzufügen von Google AutoML zu Phrase Language AI ist der „Bucket name“ erforderliche Information aufgrund der Unterstützung und potenziellen Nutzung von MT Glossaren.

  • Google Translate

    Wichtig

    Ab dem 3. November 2020 werden alle neuen Projekte, bei denen Google Translate als ausgewählte Engine verwendet wird, automatisch die Google-Engine für neuronale maschinelle Übersetzung (NMT) anstelle der Google-Engine für statistische maschinelle Übersetzung (SMT) verwenden.

  • Human Science

  • KantanMT

  • Kodensha MT

  • Language Weaver (ehemals SDL BeGlobal)

  • Microsoft Custom Translator (in Microsoft Azure den Speicherort auf „Global“ setzen)

  • Microsoft Translator / Microsoft Translator Hub

  • Mirai Translator

  • MoraviaMT

  • NICT

  • NpatMT

  • Omniscien Technologies

  • PangeaMT

  • PROMT

  • Rozetta T-3MT

  • Rozetta T-4OO

  • SDL Language Cloud

  • Skrivanek

  • Sunda MT

  • Systran

  • Systran PNMT

  • T-tact AN-ZIN

  • Tauyou

  • Tauyou Real-time

  • Tencent TranSmart

    Wichtig

    Nur verfügbar durch Phrase Language AI. Unterstützt zh -> en und en-> zh Übersetzungen (vereinfacht nur Chinesisch).

  • Tilde MT

  • Toshiba

  • Ubiqus NMT

  • Yandex

War dieser Beitrag hilfreich?

Sorry about that! In what way was it not helpful?

The article didn’t address my problem.
I couldn’t understand the article.
The feature doesn’t do what I need.
Other reason.

Note that feedback is provided anonymously so we aren't able to reply to questions.
If you'd like to ask a question, submit a request to our Support team.
Thank you for your feedback.