Die Termmorphologie wird auf verschiedene Weise behandelt:
-
Fuzzy-Übereinstimmungen
-
Genau-Übereinstimmungen
-
Wortstammtrennung
-
Synonymverwendung
Standardmäßig ist der Übereinstimmungstyp für neue Begriffe auf Fuzzy eingestellt.
Wenn der Übereinstimmungstyp ist, kann ein Suffix an ein Wort angehängt werden, und es wird trotzdem übereingestimmt.
Beispiele:
Die einfache Morphologie von hinzugefügten Zeichen.
-
Auto wird auch Autos übereinstimmen.
-
Spiel wird auch Spiele übereinstimmen.
Die maximale Suffixlänge beträgt 6 für fusional Sprachen und 20 für agglutinative Sprachen.
Fuzzy-Übereinstimmungen sind möglicherweise nicht geeignet für Wörter wie Vertrag, da Auftragnehmer eine falsche Übereinstimmung wäre. Dieser Begriff wäre besser mit genauer Übereinstimmung Einstellungen bedient.
Genau-Übereinstimmung wird auch für Abkürzungen empfohlen; AN könnte eine genaue Übereinstimmung erfordern und auch Groß-/Kleinschreibung sein. Nur AN würde eine genaue Übereinstimmung bieten, während an, und oder UND dies nicht tun würden.
Jeder Begriff, der ausschließlich aus Sonderzeichen besteht (alles, was kein Unicode-Buchstabe oder -Zeichen ist, mit Ausnahme von |), wird automatisch als genaue Übereinstimmung markiert. Fuzzy-Matching behandelt diese Sonderzeichen nicht gut, was zu unzuverlässigen oder falschen Übereinstimmungen führt.
Um die Übereinstimmung für Begriffe mit reicher Morphologie zu verbessern, wenn sich ein Teil eines Wortes aufgrund des Kontexts ändert, kann eine Grenze zwischen dem Wortstamm (dem Teil, der sich nicht ändert) und dem Suffix (dem Teil, der sich ändert) durch das Einfügen eines Pipe-Zeichens | definiert werden.
Fuzzy-Begriffe werden bis zu maximal 6 Zeichen nach dem Pipe-Zeichen erkannt.
Beispiele:
Für einige Begriffe funktioniert die Fuzzy-Übereinstimmung oder das Trennen des Stammes nicht; blatt und blätter würden in einem Begriff nicht übereinstimmen. In diesem Fall verwenden Sie Synonyme.
Beispiel:
Klicken Sie durch tutorial zur Arbeit mit der Term-Morphologie.