In den vorigen Kapiteln wurde untersucht, wie aus dem gemeinsamen Auftreten von Wörtern in Texten Rückschlüsse auf ihre assoziativen Beziehungen gezogen werden können. Es ist eine interessante Frage, ob sich diese Vorgehensweise auch auf zweisprachig vorliegende Texte übertragen läßt. Es soll also ermittelt werden, welche Wörter eines Ausgangstextes mit welchen Wörtern aus der Übersetzung assoziiert sind. Zu erwarten wäre, daß sich starke Verbindungen insbesondere dann ausbilden, wenn ein Wort des Ausgangstextes häufig mit demselben Wort der Zielsprache übersetzt wurde. Durch Ermittlung dieser starken Assoziationen müßte es also möglich sein, die zur Übersetzung eines Wortes des Ausgangstextes gebrauchten Wörter der Zielsprache zu bestimmen und damit ein Wörterbuch zu erstellen.
Entsprechend den Ausführungen in Kapitel ist es zur
Berechnung von Kontiguitätsassoziationen nötig zu definieren,
was unter dem ``gemeinsamen Auftreten'' von Wörtern verstanden
werden soll. Im einsprachigen Fall wurde vom gemeinsamen Auftreten
beispielsweise dann gesprochen, wenn zwei Wörter im selben Satz
vorkamen. Übertragen auf den zweisprachigen Fall besteht dann
eine Beziehung zwischen zwei verschiedensprachigen Wörtern,
wenn sie in einander entsprechenden Sätzen von Ausgangstext und
Übersetzung vorkommen.
Diese Definition setzt allerdings voraus, daß die Zuordnung der Sätze zwischen Ausgangstext und Übersetzung nachträglich rekonstruierbar ist. Erfahrungsgemäß bereitet diese Zuordnung einem Sprachkundigen wenig Schwierigkeiten. Um aber auch größere Textmengen bearbeiten zu können, ist ein automatisches Verfahren zur Satzzuordnung unerläßlich. Hilfreich ist es dabei, wenn der Übersetzungsvorgang im Wesentlichen satzweise vorgenommen wurde. Brown et al. (1991) stellten anhand eines kleinen Auszugs der Protokolle des kanadischen Parlamentes fest, daß ungefähr 90% der englischen Sätze tatsächlich mit nur einem einzigen französischen Satz korrespondieren.