Die Morphologie von Begriffen wird auf verschiedene Weise behandelt:
-
Fuzzy-Übereinstimmungen
-
Genauübereinstimmungen
-
Wortstammtrennung
-
Synonymverwendung
Standardmäßig ist der Übereinstimmungstyp für neue Begriffe auf Fuzzy eingestellt.
Wenn der Übereinstimmungstyp ist, kann ein Suffix an ein Wort angehängt werden und es wird trotzdem übereinstimmen.
Beispiele:
Die einfache Morphologie von hinzugefügten Zeichen.
-
Auto wird auch Autos übereinstimmen.
-
Spiel wird auch Spiele übereinstimmen.
Die maximale Suffixlänge beträgt 6 für fusional Sprachen und 20 für agglutinative Sprachen.
Fuzzy-Übereinstimmungen sind möglicherweise nicht geeignet für Wörter wie Vertrag, da Vertragspartner eine falsche Übereinstimmung wäre. Dieser Begriff wäre besser mit genauer Übereinstimmung Einstellungen bedient.
Genauübereinstimmung wird auch für Abkürzungen empfohlen; AN könnte eine genaue Übereinstimmung erfordern und auch Groß-/Kleinschreibung sein. Nur AN würde eine genaue Übereinstimmung bieten, während ein, und oder UND dies nicht tun würden.
Jeder Begriff, der ausschließlich aus Sonderzeichen besteht (alles, was kein Buchstabe oder Zeichen ist, mit Ausnahme von |), wird automatisch als genaue Übereinstimmung markiert. Fuzzy-Übereinstimmungen behandeln diese Sonderzeichen nicht gut, was zu unzuverlässigen oder falschen Übereinstimmungen führt.
Um das Matching für Begriffe mit reicher Morphologie zu verbessern, wenn sich ein Teil eines Wortes aufgrund des Kontexts ändert, kann eine Grenze zwischen dem Wortstamm (dem Teil, der sich nicht ändert) und dem Suffix (dem Teil, der sich ändert) definiert werden, indem ein Pipe-Zeichen | eingefügt wird.
Fuzzy-Begriffe werden bis zu maximal 6 Zeichen nach dem Pipe-Zeichen erkannt.
Beispiele:
Für einige Begriffe funktioniert das Fuzzy-Matching oder das Trennen des Stammes nicht; leaf und leaves würden in einem Begriff nicht übereinstimmen. In diesem Fall verwenden Sie Synonyme.
Beispiel:
Klicken Sie durch tutorial zur Arbeit mit der Morphologie von Begriffen.