next up previous contents index
Next: Zusammenfassung Up: Simulation des Assoziierens auf Previous: Methode

Simulationsergebnisse

Zunächst wurden die Assoziationen zu den 45 unterschiedlichen Wortpaaren, die sich aus den 10 gewählten Substantiven ohne Berücksichtigung der Reihenfolge bilden lassen, berechnet, indem die Assoziationsvektoren der einzelnen Wörter addiert wurden. Tabelle gif zeigt die auf diese Weise erhaltenen stärksten Assoziationen auf das Stimuluspaar Sorge Krankheit und vergleicht sie mit den von den Versuchspersonen gegebenen assoziativen Antworten.

Über alle 45 Beispiele gemittelt ergibt sich folgendes Bild: Während eine assoziative Antwort einer Versuchsperson auf ein Wortpaar im Mittel von 3,6% der übrigen Versuchspersonen ebenfalls genannt wird (vergl. Tabelle gif), geben nur etwa 0,3% der Versuchspersonen die vorhergesagte assoziative Antwort, also das Wort auf dem ersten Rangplatz. Da nur in vier Fällen die vom System vorhergesagte Antwort überhaupt von irgendeiner Versuchsperson genannt wird, ist dieser Wert aber statistisch wenig abgesichert.

 

Sorge Krankheit
Experiment Simulation
Rang Wort Vpn Rang Wort Vpn
26 Tod 6 1 Aids 1
41 Angst 3 2 Virus 0
275 Krankenhaus 3 3 Immunschwäche 0
1607 Not 2 4 Patienten 0
1 Aids 1 5 Lepra 0
16 Arzt 1 6 Kranken 0
1027 Geld 1 7 Erreger 0
23 Gesundheit 1 8 Erkrankung 0
19 Krebs 1 9 Symptome 0
667 Leid 1 10 infiziert 0
357 Mutter 1 11 Krankheiten 0
5697 Pech 1 12 AIDS 0
7463 Pessimismus 1 13 Infektion 0
410 Problem 1 14 Medizin 0
1602 schlecht 1 15 Malaria 0
600655 schmerzen 1 16 Arzt 1
1829 tot 1 17 Diagnose 0
5679 traurig 1 18 Behandlung 0
3285 Unglück 1 19 Krebs 1
807507 unheilbar 1 20 Erkrankten 0
3882 Walter 1 21 Ausbreitung 0
Tabelle: Experimentelle und vorhergesagte assoziative Antworten auf das Stimuluspaar Sorge Krankheit. Für jedes Wort ist die Häufigkeit der Nennung im Assoziationsexperiment und der Rangplatz bei der Simulation angegeben.

 

Eine auf statistischen Schwankungen weniger empfindliche Methode zur Bewertung der Ergebnisse beruht auf der Berechnung des Medians  der Simulationsrangplätze aller von den Versuchspersonen genannten assoziativen Antworten. Von den Versuchspersonen mehrfach genannte Antworten gehen bei der Medianbildung mehrfach ein. Für das Beispiel in Tabelle gif ergibt sich für die in der linken Spalte aufgeführten Rangplätze ein Median von 275. Die Bildung des Medians hat gegenüber einer Mittelwertbildung den Vorteil, daß sie auf einzelne Ausreißer unempfindlicher reagiert. Im genannten Beispiel haben etwa die beiden Wörter schmerzen und unheilbar nur deswegen extrem hohe Rangplätze, weil ihre Korpushäufigkeit unter 100 liegt und ihnen demnach gemäß Formel gif eine Assoziationsstärke von 0 zugewiesen wurde.

 

Stimuli Lösung Matches Rang
umgangssprachlich tex2html_wrap_inline23588 : dürftig, schlecht mau tex2html_wrap_inline23588 9138 1787
antiker griechischer Hafen Aulis tex2html_wrap_inline23588 28589 3604
kurzer heftiger Regenschauer Guß 9138 1107
fruchtbare Stellen in der Wüste Oasen 28589 152
dem Wind zugekehrte tex2html_wrap_inline23588 Seite Luv tex2html_wrap_inline23588 9138 6499
germanische Frühlingsgöttin tex2html_wrap_inline23588 Ostara tex2html_wrap_inline23588 40901 22130
Schilderung friedlichen Lebens Idylle 40901 343
griechischer Meeresgott tex2html_wrap_inline23588 Triton tex2html_wrap_inline23588 40901 15417
Außenseiter im Sport (englisch) outsider tex2html_wrap_inline23588 56924 6124
Farbton tex2html_wrap_inline23588 rosa 15561 543
durch, mittels (lateinisch) per 9138 149
germanischer tex2html_wrap_inline23588 Urriese tex2html_wrap_inline23588 Ymir tex2html_wrap_inline23588 15561 9503
schwedischer Königsname Gustav 40906 5
Autokennzeichen tex2html_wrap_inline23588 Uelzen tex2html_wrap_inline23588 UE tex2html_wrap_inline23588 1655 813
Papstname tex2html_wrap_inline23588 Paul 15561 188
englisch: zu, nach to 1655 1
Himmelsrichtung tex2html_wrap_inline23588 Osten 28589 4
höherstehend tex2html_wrap_inline23588 über 15561 8
Staat in Hinterindien tex2html_wrap_inline23588 Laos 15561 1
Stadt in Oberitalien tex2html_wrap_inline23588 Ravenna 49231 4073
Tabelle: Lösen eines Kreuzworträtsels mit dem Assoziationsprogramm. Wörter mit Korpushäufigkeit unter 30 sind mit `` tex2html_wrap_inline23588 '' markiert.

 

Als Maß für die Güte der Simulationsergebnisse eignet sich der Median der Simulationsrangplätze über alle 45 Wortpaare. Dieser hat bei Addition der Assoziationsvektoren zu einzelnen Stimuluswörtern einen Wert von 1404, bei Multiplikation hingegen einen Wert von 6255. Diese Werte sind im Vergleich zur Gesamtzahl der Wörter im Vokabular (978 010) zu betrachten. Diesem Ergebnis zufolge liefert die Addition der Vektoren bessere Vorhersagen als die Multiplikation. Diese Tendenz hat sich auch bestätigt, wenn Formel gif durch Formel gif aus Kapitel gif ersetzt wurde.

In einem weiteren Experiment wurde untersucht, ob sich das Lösen von Kreuzworträtseln  auf das Assoziieren zu einem oder mehreren Stimuluswörtern zurückführen läßt und damit mit dem Assoziationsprogramm simuliert werden kann. Die in einem Kreuzworträtselgif angegebenen Stichworte wurden als Stimuluswörter für das Assoziationsprogramm verwendet. Da der im Kreuzworträtsel verwendete Wortschatz zu einem großen Teil aus sehr seltenen Wörtern besteht und dadurch das Problem der geringen Häufigkeiten gravierend ist, wurde der Algorithmus zur Berechnung der Assoziationen etwas modifiziert. Verwendet wurde Formel gif, die seltene Wörter begünstigt. Diese Begünstigung seltener Wörter wurde jedoch mit Hilfe einer Exponentialfunktion wieder teilweise neutralisiert. Mit Hilfe schwacher indirekter Assoziationen konnten die Auswirkungen des Sparse-Data-Problems reduziert werden (vergl. Kapitel gif). In der sich ergebenden Rangliste der assoziativen Antworten wurden alle Wörter gelöscht, deren Länge nicht der Anzahl der im Rätsel vorgegebenen Kästchen entsprach.

Tabelle gif zeigt, welche Rangplätze die korrekten Lösungen auf den vom Simulationsprogramm ausgegebenen Ranglisten belegten. Die erhaltenen Rangplätze sind relativ zur gesamten Anzahl von Wörtern der betreffenden Länge zu sehen. In zwei von 20 Fällen kam das Programm auf die korrekte Lösung, und in fünf Fällen liegt das Lösungswort auf einem der vordersten zehn Rangplätze. Schlechte Vorhersagen finden sich überwiegend dort, wo Stimulus- oder Lösungsworte sehr niedrige Korpushäufigkeiten aufweisen. (So hat etwa ``Frühlingsgöttin'' die Korpushäufigkeit 0.) Sicherlich ließen sich die Resultate erheblich verbessern, wenn das Korpus um spezielles Textmaterial, etwa Wörterbücher oder Kreuzworträtsellexika, erweitert würde.


next up previous contents index
Next: Zusammenfassung Up: Simulation des Assoziierens auf Previous: Methode

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997