next up previous contents index
Next: Korpusrepräsentativität und das Problem Up: Ansätze zur Verbesserung der Previous: Kookkurrenzhäufigkeit relativ zu einer

Berücksichtigung der Wortart

Mit Hilfe eines effizient arbeitenden Programmes zur Wortarten-Annotierung (vergl. Kapitel gif) kann ein großes Korpus mit Wortartenmarkierungen versehen werden. Dadurch wird es möglich, statistisch zu untersuchen, inwiefern die Wortarten von Stimulus- und Responsewörtern das Assoziationsverhalten beeinflussen. Einerseits können Statistiken darüber erstellt werden, ob eine Abhängigkeit zwischen der Wortart  des Stimulus und der Wortart der Response besteht. Andererseits kann geprüft werden, ob sich assoziative Verknüpfungen verstärkt zwischen bestimmten Satzgliedern (etwa Subjekt-Prädikat oder Subjekt-Objekt) bilden. Einen solchen Ansatz beschreiben Basili & Pazienza (1992). In diesem Zusammenhang relevante Techniken findet man aber auch bei der statistischen Extraktion von Verb-Substantiv-Kollokationen (Breidt, 1993).

Ruge (1995) sowie Ruge et al. (1991) gehen davon aus, daß Synonyme  in ihren Heads  und Modifiern  übereinstimmen.gif Durch eine regelbasierte syntaktische Analyse eines Korpus gelang es ihr, die vorhandenen Head-Modifier-Relationen mit einem Recall von 0,85 und einer Precision von 0,86 zu erkennen.

Eigene Versuche zur Berechnung von Gegenteils-Assoziationen  zeigten, daß es sich auf die Ergebnisse günstig auswirkt, wenn angenommen wird, daß die Wortarten von Stimulus und Response übereinstimmen müssen. Einiges deutet sogar darauf hin, daß sich auf diese Art das Gegenteil eines Wortes sinnvoll definieren läßt: Das Gegenteil eines Wortes wäre dann dasjenige andere Wort derselben Wortart, das die höchste Assoziationsstärke aufweist. Hierbei ist es zweckmäßig, auch die Flexionsformen der Wörter zu berücksichtigen. Dadurch wird erreicht, daß als Gegenteil von klein groß, aber als Gegenteil von kleiner größer berechnet wird.



Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997