Pro und Kontra aus dem Rauschen – TU Darmstadt entwickelt Argumentsuche für Internet-Texte

Teilen

InternetStrukturierte Entscheidungshilfe: Das Forschungsprojekt „ArgumenText“ vom Fachgebiet Ubiquitous Knowledge Processing hat einen Weg gefunden, konkrete Pro- und Kontra-Argumente zu beliebigen Themen aus dem Rauschen des Internets zu filtern.

Wie kann jemand, der konkrete Argumente zu einer Frage sucht – etwa, um eine Investitionsentscheidung zu treffen oder ein Thema fundiert zu recherchieren – im Internet fündig werden? An dieser Frage arbeiten Wissenschaftlerinnen und Wissenschaftler des Fachgebiets Ubiquitous Knowledge Processing (UKP) der TU Darmstadt.

Seit kurzem gibt es einen Demonstator des Suchsystems. Wer nach dem Thema „Nuclear Energy“ forscht, bekommt nach wenigen Sekunden knapp hundert Argumente für und gegen Atomkraft angezeigt – von verschiedensten Internet-Seiten. Zum Vergleich: eine Google-Suche zum selben Thema erbringt rund 268 Millionen Treffer.

Dafür werden die im Internet vorhandenen Texte mittels neuronaler Netze untersucht, als für das Suchthema relevant oder nicht relevant eingestuft und dann auf Argumente abgeklopft. „Hier werden nicht nur einzelne Wörter gesucht, auch grammatische Strukturen, Kontexte und Semantik werden berücksichtigt, um zu entscheiden, ob eine Aussage ein ,Argument‘ ist oder nicht und ob es auf der Pro- oder der Kontra-Seite steht“, erklärt Dr. Johannes Daxenberger, der im Team von Professorin Iryna Gurevych als einer der zwei Projektverantwortlichen an ArgumenText arbeitet.

Die hinter ArgumenText liegenden Algorithmen entwickelt das Team im Fachgebiet selbst, aufbauend auf ersten Versuchen, die 2014 mit einem Korpus aus studentischen Aufsätzen starteten. „Die Herausforderung war, ein System, das auf einer Sorte Text trainiert war, auf beliebige Textformen übertragbar zu machen“, sagt Dr. Christian Stab, der zweite Projektverantwortliche. „In wissenschaftlichen Texten wird zum Beispiel völlig anders argumentiert als in Sozialen Medien.“

Das Projekt ist derzeit in der Validierungsphase. Hauptzielgruppen seien zunächst Entscheiderinnen und Entscheider aus der Wirtschaft, die bewerten müssten, ob sich der Einstieg in eine Innovation lohne, sowie Journalistinnen und Journalisten, die für Recherchen schnell und fundiert in Themen einsteigen müssten, erklärt Daxenberger. Zur Validierung bereiten die beteiligten Wissenschaftlerinnen und Wissenschaftler derzeit auch den Einsatz für deutschsprachige Texte vor. Auch eine Echtzeitsuche über die ständig wachsende Zahl von Texten im Internet wird dann möglich sein. Die Wissenschaftlerinnen und Wissenschaftler arbeiten darauf hin, dass die Argumente später den Nutzerinnen und Nutzern aggregiert, also nach Themen geordnet, präsentiert werden.

Argument Mining, das Erkennen von sprachlichen Argumenten mit Mitteln der Informatik, werde in der Forschung der Digital Humanities immer wichtiger und sichtbarer, bilanzieren Daxenberger und Stab. Die TU war auf diesem Gebiet früh dabei. „Wir sind mit unserer Arbeitsgruppe gut und sichtbar etabliert“, sagt Professorin Iryna Gurevych, die Leiterin des UKP. Dafür arbeitet das Team am Fachgebiet interdisziplinär etwa mit dem TU-Fachbereich Gesellschafts- und Geschichtswissenschaften, aber auch mit anderen Hochschulen aus dem Verbund der Rhein-Main-Universitäten zusammen.

Weitere Informationen

Zu ArgumenText finden Sie in der neuesten Ausgabe der hoch3FORSCHEN: https://liup.de/J0gpI

Quelle: TU Darmstadt


Teilen