90% aller Nachrichten kommen von Roboterjournalisten

netter rob sitzend laptop
Diese Prognose hat die altehrwürdige BBC für das Jahr 2022 gemacht. Dass sind nur noch ganze sechs Jahre. Wie kommt die eher britisch-zurückhaltende BBC auf eine solche – Vision? Schreckensvision? Geht 2022 ein Herausgeber durch menschenleere, verwaiste Redaktionsflure, während auf dem Server hunderte von Geschichten produziert werden?

Die BBC hat Recht. Nur wird der Roboterjournalismus, so wie er etwas detaillierter auf beschrieben wird, kaum einen Journalisten um seinen Arbeitsplatz bringen. Die Kraft der Software liegt in ihrer Fähigkeit, in Sekunden Geschichten zu erzählen, die es vorher gar nicht oder nur sehr selten gab. Und es wird ein Zusammenspiel zwischen Journalisten und Daten-Analysten geben, gegen die die Kompetenzen heutiger “Datenjournalisten” nur eine Trockenübung waren.

Mein zurzeit schwierigstes Projekt, für ein US-Magazin, macht ganz gut deutlich, welche Art von Stories neu erfunden werden: wir entwickeln eine alle 4 Wochen erscheinende Beitragsserie, die sich auf hohem Niveau mit den zukünftigen Migrationsbewegungen in Afrika beschäftigt. Zukunftsprojektionen, die auf ganz unterschiedlichen Datenquellen aufsetzen: Daten der Weltgesundheitsorgansiation, Daten der Weltbank zu unemployment rates, Angaben der UNESCO zu Schulabgängern und Prognosen von Branchenexperten zu den zu erwartenden Ernteerträgen. Alle diese Zahlen werden zusammengeführt und , die erstellte Prognose wird an allen zur Verfügung stehenden Prognosen und den eingetretenen realen Entwicklungen gemessen.

Ohne einen Journalisten, der das Endprodukt, also den kompletten Artikel skizzieren kann, ist diese Arbeit genauso wenig möglich wie ohne den erfahrenen Datenanalysten, der die inhaltlichen Anforderungen der Redaktion in mathematische Regeln und referenzierende Datenfelder “übersetzt”. Und doch werden diese Artikel nie 1:1 veröffentlicht werden, sie werden feingeschliffen, mit Reportage-Elementen angereichert und um Interview-Passagen ergänzt. Roboterjournalismus und Klassik in friedlicher, fruchtvoller Koexistenz. Das Schreiben des Rohartikels spart der Redaktion “nur” etwa 4 Arbeitstage, die Datensichtung aber hätte einen Redakteur etwa vier Wochen beschäftigt, für jeden Artikel. Das erledigt die Software nun, nachdem einmal acht Wochen Entwicklungszeit investiert worden sind, in wenigen Sekunden.

Ach ja: ob der HSV nur bei bestimmten Wetterlagen verliert, lässt sich genauso blitzschnell vertextlichen. Und warum schreibt niemand über gar nicht so exotische Sportarten wie Rugby oder die zweite Liga Handball? Über die Zulassung von Traktoren und die Zahl neuzugelassener Medikamente? Richtig, die Zielgruppen sind bislang viel zu klein. Welche Auswirkungen haben die Twitter-Posts von Donald Trump auf die internationalen Börsen? Dazu braucht man nur die um 15 Minuten verzögerten (und damit bezahlbaren) Index-Kurse der wichtigsten Börsenplätze und Trumps Tweet – kein Hexenwerk und sehr, sehr spannend. Auch für eine Software 🙂

Zwei Ansätze im Roboterjournalismus kämpfen um Gold

Roboter spielt Fußball

Noch vor zwei Jahren war automatisch erstellter Inhalt im deutschsprachigen Raum fast ausschließlich bei Produktbeschreibungen zu finden: die “Betextung” von Winterreifen ist halt einfacher, als einen lesenswerten Fußballbericht von einer Software verfassen zu lassen. Seit einem Jahr werden immer mehr Wetter-, Börsen- und eben auch Sportberichte von emotionslosen Roboteranwendungen verfasst, denen emotionale Elementen von Programmierern mühsam beigebracht werden müssen. Fußball funktioniert nur mit Dramatik und Emotion, diese aber sind aus Datensätzen nicht einfach zu konstruieren. Jetzt aber kommt schon eine weitere Entwicklung, die die Zahl von Algorithmen verfasster Inhalte weiter wachsen lassen wird: “Do-it-yourself-Robotjournalism“.

Zur Zeit überwiegt noch das Projektgeschäft: ein Dienstleister in dem Bereich Computertexte bekommt einen mehr oder weniger klar definierten inhaltlichen Wunsch, das Entwicklerteam schliesst sich für mehrere Wochen ein und am Ende bekommt der Kunde schlüsselfertige Inhalte, die nur noch in das ContentManagementSystem integriert werden müssen. Oder die gleich auf einer Seite des Kunden veröffentlicht werden. Der Vorteil: bis die Inhalte publikationsfähig sind hat der Kunde keinen bis geringen zeitlichen und personellen Aufwand. Der Nachteil: die Abhängigkeit von dem Inhaltelieferanten als Dienstleister liegt bei 100%. Das gilt besonders für alle Änderungen und Ergänzungen, die als Sonderwunsch bezahlt werden müssen. Eigenes Knowhow wird nur sehr wenig aufgebaut.

Immer stärker holt jetzt “AutomatedContentSoftware” auf, bei denen der Kunde selbst mit einer Standardsoftware Inhalte aus Daten schafft. Diese Möglichkeit wurde vor gar nicht solanger Zeit noch belächelt, weil es kaum vorstellbar schien, dass sich Redaktionen die Zeit nehmen, selbst an der Wort- und Textqualität einer Automatisierungssoftware zu “schrauben”. Inzwischen arbeiten bereits renommierte Großverlage daran, mit einer solchen Basissoftware eigene, automatisch erstellte Inhalte zu schaffen. Noch gibt es die typischen Unzulänglichkeiten einer neuartigen Softwaregeneration, aber der Wunsch, dieses Werkzeug in der eigenen Redaktionen unter der eigenen Hoheit zu haben, löst derzeit eine erhebliche Nachfrage aus.

90% aller Nachrichten werden im Jahr 2022 automatisch erstellt sein – die BBC dürfte mit dieser Prognose Recht behalten. Denn auch Pferdeportale werden aus ihren bis zu 40.000 Einzelportraits prominenter Vierbeiner, die bislang oft nur als “Datenblatt” existieren, gerne Texte machen lassen, die sich dann auch noch mit jedem gewonnenen Wettkampf automatisch aktualisieren.