Roboterjournalismus? Textualisierung hilft Medien und Nutzern bei Datenflut!

Datensichtung

Auch wenn die im Deutschen gerne verwendeten Substantivierungen in jeder guten Redaktion auf der schwarzen Liste stehen: hier passt es. Nach der “Visualisierung” von Fakten und Ereignissen durch Infografiken hat das Zeitalter der “Textualisierung” begonnen, was weit mehr ist als die automatische Text-Zusammenfassung von Daten. Eine Software zu entwickeln, die neben dem gesamten deutschen Wortschatz eigenständig die sperrige deutsche Grammatik beherrscht, war die dafür zu schaffende Basis. Trotzdem ist die eigentliche Textualisierung nur ein Ergebnis dieser Entwicklung, der Prozess davor ist mindestens genauso entscheidend und für die weitere Entwicklung des Journalismus wichtig, ohne selbst den Anspruch zu erheben, Journalismus zu sein. Der von der Software vor der Textualisierung ebenso automatisch geleistete Prozess davor ist

  • die Identifizierung relevanter Daten und Datenquellen
  • die Analyse der Daten
  • die Bewertung und Gewichtung der Daten
  • die Umsetzung der Daten in einer informations- und zielgruppenrelevanten Dramaturgie

Diese vier Prozesschritte kann in der Tat eine Software wesentlich schneller und präziser leisten als ein Mensch. Trotzdem stellt sich nicht die Frage, ob hier möglicherweise eine weiterer Stellenabbau in der ohnehin von radikalen Einschnitten gekennzeichneten Medienlandschaft droht. Denn der fünfte Schritt kann zu einer Wertschöpfung führen, die die Software eben nicht zu leisten vermag: die automatisch generierte Textzusammenfassung kann zwar qualitativ bedenkenlos veröffentlicht werden, aber bietet auch die Chance, dass die Redaktion in Sekundenbruchteilen auf Ereignisse in datenbasierten Entwicklungen aufmerksam gemacht wird, dessen Herausfinden bislang mit erheblichem Zeitaufwand oder nach dem Zufallsprinzip erfolgte.

Wenn eine Stadt 60 Meß-Stationen für Feinstaub hat, ergibt dies täglich eine Unmenge an Meßdaten, mit deren Sichtung man keinen Volontär ernsthaft quälen möchte. Die Software schreibt im redaktionellen Arbeitsalltag der Zukunft 95% der sich aus den Meßdaten ergebenen Berichte: Stadtteil- und sogar auf Stadtviertel bezogen, kurze Informationstücke und “übergibt” 5% der Ereignisse als textliche Rohfassung an das lokale Investigativ-Team, weil hier signifikante Abweichungen festgestellt wurden. Dann machen die Journalisten ihren Job: Interviews mit Anwohnern, Berichte über die möglichen Ursachen, Reportagen von der seit kurzem stark belasteteten Straße (Veränderung der Verkehrsführung? Umleitungen? Baustellen?) Würde eine solche Software nicht in den Redaktionen eingesetzt werden, würde auch die seit Jahren laufende “open data“- Initiative der zahnlose Papiertiger bleiben, die sie bislang ist: immer mehr von Behörden veröffentliche Zahlen werden von immer weniger Menschen wahrgenommen, weil die “Gatekeeper”-Ressourcen, die sichtenden und selektierenden Journalisten, längst in der Datenflut untergehen. Aus dem öffentlichen Zugang zu Daten wird so Desinformation.

Ähnlich sieht es bei der Sport- und Börsenberichterstattung aus: selbst die Textualisierer des US-Unternehmens narrative science würden trotz CIA-Förderung kaum auf die Idee kommen, dass ihre Beiträge über Baseballspiele die Emotionen, Erfahrungen und das Hintergrundwissen eines langjährigen Sportreporters ersetzen können. Genauso sinnlos ist es, eine Software über die Spitzenbegegnung in der ersten oder zweiten Bundesliga schreiben zu lassen. Aber was ist mit den Millionen von Menschen, die sich jedes Wochenende für die rund 30.000 Spiele der Amateur-Ligen begeistern, weit mehr als die erste und zweite Bundesliga zusammen an Zuschauern hat? Eine Software kann sogar für eine Zielgruppe von 50 Menschen zu einem absolut vertretbaren Preis einen lesenswerten Spielbericht liefern, der ausschließlich auf den ohnehin gemeldeten Daten zum Spielablauf beruht. Den Reporter am Rande des Aschenplatzes gibt es schon lange nicht mehr, hier werden neue Inhalte geschaffen, die es sonst nicht geben würde.

Dasselbe gilt für die Börsen- und Finanzberichterstattung: keine Verlag käme auf die Idee, von der Redaktion alle 5 Minuten einen aktualisierten Bericht zu den Kursverläufen fast jeder Aktie zu erwarten, bis zu 3.000 Berichte an einem einzigen Handelstag. Das Portal Finanzen100.de hat mit dem Einsatz solcher von der Startup text-on automatisch aus Börsendaten erzeugten Inhalte komplett neue Inhalte geschaffen,  die es sonst schlicht nie gegeben hätte. Das ist keine Lyrik, das ist keine Prosa und auch nicht Pulitzer-Preis verdächtig – und will es auch gar nicht sein:

BMW-Aktie legt zu
Der Anteilsschein von BMW verzeichnet heute Kursgewinne: Die Aktie von BMW steigt bis zum Vormittag um 1,91% auf 106,45 Euro.BMW gehört damit zu den besseren Werten im DAX, für den es derweil um 1,21% nach oben ging. Der heutige Anstieg des BMW-Werts bringt dem Anteilsschein in der Performance-Tabelle einen Platz unter den ersten Zehn ein. Der Titel erreicht Platz 10 von dreißig. Neben BMW befinden sich mit Volkswagen und Daimler noch zwei weitere Unternehmen aus dem Bereich Autohersteller im DAX. Im Branchenvergleich setzt sich der Autobauer aus München mit der heutigen Performance ganz klar an die Spitze. Die durchschnittliche Performance im Sektor liegt heute bei 1,63%.

In der weiteren Entwicklung können diese Berichte um historische Vergleiche und die Entwicklungen an anderen internationalen Börsenplätzen ergänzt werden, die Zahl der “anschließbaren” Datenquellen ist nicht limitiert und eine menschliche Sichtung -zig Tausender von Datenressourcen und Echtzeit-Informationen völlig unmöglich. Auch hier bleibt die “Story” hinter den Zahlen und Fakten dem wirklichen Journalisten überlassen.

Von einer Software unterstützt werden Journalisten so wieder Herr oder Frau der Datenflut , die sonst kaum noch beherrschbar ist.

P.S. Hinweis – der Autor ist Gründer und Gesellschafter der text-on GmbH in Berlin

 

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *