next up previous contents index
Next: Assoziative Ähnlichkeit zwischen Texten Up: Ausblick Previous: Ausblick

Ein mehrstufiges Modell zur Suchwortgenerierung

 

Als Ergänzung zum bislang beschriebenen assoziativen Ansatz zur Suchwortgenerierung soll im folgenden ein zweistufiges Modell skizziert werden, mit dem durch Einbeziehung der Prägnanz von Wörtern möglicherweise verbesserte Ergebnisse erreicht werden können. Es wird angenommen, daß es sich bei der Suchwortgenerierung um einen zweistufigen Prozeß handelt: In Phase 1 werden sehr häufige und wenig prägnante Wörter in der Problembeschreibung eliminiert. Danach werden in Phase 2 in der bereits beschriebenen Weise die Assoziationen zu den verbliebenen Wörtern berechnet. Falls erforderlich werden anschließend in einer dritten Phase unter den berechneten Assoziationen wiederum solche mit hoher Korpushäufigkeit und geringer Prägnanz entfernt.

Die Prägnanz tex2html_wrap_inline24150 eines Wortes i kann dabei als die Varianz seiner insgesamt V (Anzahl der Wörter im Vokabular) assoziativen Verbindungsstärken tex2html_wrap_inline24156 definiert werden:

equation12792

   figure12802
Abbildung: Zusammenhang zwischen Prägnanz P und Korpushäufigkeit H für die drei Begriffskategorien tex2html_wrap_inline24135 ( tex2html_wrap_inline23685 ), tex2html_wrap_inline24145 ( tex2html_wrap_inline24180 ) und tex2html_wrap_inline24139 ( tex2html_wrap_inline24184 ).

Abbildung gif zeigt auf der Basis der 95 Rechercheprotokolle für die drei Begriffskategorien tex2html_wrap_inline24135 , tex2html_wrap_inline24145 und tex2html_wrap_inline24139 den Zusammenhang zwischen Prägnanz und Korpushäufigkeit. Es ist keine deutliche Clusterbildung erkennbar. Wie in Tabelle gif dargestellt, unterscheiden sich jedoch die über alle 95 Beispiele gemittelten Werte von Prägnanz und Korpushäufigkeit für die drei Begriffskategorien deutlich. Obwohl mit den beiden Kriterien Prägnanz und Korpushäufigkeit also keine eindeutige Trennung der Begriffskategorien zu erzielen ist, könnten sie dennoch zu einer Verbesserung der Simulationsergebnisse beitragen.

 

tex2html_wrap_inline24135 tex2html_wrap_inline24145 tex2html_wrap_inline24139
Anzahl Begriffe (in 95 Bsp.) 408 354 1631
Mittlere Prägnanz tex2html_wrap_inline24198 tex2html_wrap_inline24200 tex2html_wrap_inline24202
Mittlere Korpushäufigkeit 13145,4 8204,1 56412,5
Tabelle: Mittelwerte für Prägnanz und Korpushäufigkeit für verschiedene Begriffskategorien.

 


next up previous contents index
Next: Assoziative Ähnlichkeit zwischen Texten Up: Ausblick Previous: Ausblick

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997