next up previous contents index
Next: Zusammenfassung Up: Die Vorhersage der Aufeinanderfolge Previous: Bestimmung von Wortarten

 

Vergleich der Vorhersagen zur Lückentextergänzung mit experimentellen Ergebnissen

 

Peter Sedlmeier führte an der Universität Salzburg ein Experiment zur Lückentextergänzung durch. Hierbei wurden zwei studentischen Versuchspersonengruppen mit jeweils etwa 30 Teilnehmern Fragebogen  mit zwölf Sätzen oder kurzen Textauszügen vorgelegt, in denen jeweils ein fehlendes Inhaltswort (Substantiv, Adjektiv oder Verb) ergänzt werden sollte. Die Textauszüge waren aus Artikeln der Wochenzeitung ``Die Zeit'' ausgewählt worden. In beiden Fragebogen waren jeweils vier Textauszüge identisch. Die weiteren acht Textauszüge unterschieden sich in der Länge des vorgegebenen Kontextes. So wurde etwa der einen Versuchspersonengruppe der Auszug ``Gemütlich sitzen sie zusammen bei Cognac und Rotwein und blicken hinab auf die [Erde].'' vorgelegt, der anderen hingegen ``Ein Vorspiel im Himmel - wie es sich für ein deutsches Literaturwerk gehört: Gott und der Teufel sind in die Jahre gekommen. Gemütlich sitzen sie zusammen bei Cognac und Rotwein und blicken hinab auf die [Erde].''

Gemittelt über alle 20 unterschiedlichen Lückentexte entschieden sich durchschnittlich 22,7% der Versuchspersonen für das im Originaltext vorgesehene Wort. Bei ausschließlicher Betrachtung der acht Kurzversionen waren es 8,4% der Versuchspersonen, bei Betrachtung der zugehörigen Langversionen hingegen 41,75%. Offenbar trägt bei den betrachteten Textauszügen ein erweiterter Kontext stark zu einer verbesserten Vorhersage bei. Demgegenüber berücksichtigt die hier vorgestellte Methode zur Simulation der Lückentextergänzung in aller Regel nur den unmittelbaren Kontext einer Textlücke: Ob die Kurz- oder Langversionen der Sätze betrachtet werden, führt nur dann zu einem unterschiedlichen Ergebnis, wenn sich der in der Langversion hinzukommende zusätzliche Text unmittelbar an die Textlücke anschließt. Dies wirkte sich aber bei den hier verwendeten Beispielen nicht auf das Ergebnis aus. Die mit den 20 Textauszügen durchgeführte Computersimulation ergab unter Verwendung des in Kapitel gif angegebenen Korpus für die fehlenden Wörter einen Median von 53 bei einem Vokabular von 65 356 Wörtern. Dieser gute Wert täuscht jedoch darüber hinweg, daß bei 9 der 20 Vorhersagen Rangplätze von weit über 200 produziert wurden.


next up previous contents index
Next: Zusammenfassung Up: Die Vorhersage der Aufeinanderfolge Previous: Bestimmung von Wortarten

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997