Zwei Ansätze im Roboterjournalismus kämpfen um Gold

Roboter spielt Fußball

Noch vor zwei Jahren war automatisch erstellter Inhalt im deutschsprachigen Raum fast ausschließlich bei Produktbeschreibungen zu finden: die “Betextung” von Winterreifen ist halt einfacher, als einen lesenswerten Fußballbericht von einer Software verfassen zu lassen. Seit einem Jahr werden immer mehr Wetter-, Börsen- und eben auch Sportberichte von emotionslosen Roboteranwendungen verfasst, denen emotionale Elementen von Programmierern mühsam beigebracht werden müssen. Fußball funktioniert nur mit Dramatik und Emotion, diese aber sind aus Datensätzen nicht einfach zu konstruieren. Jetzt aber kommt schon eine weitere Entwicklung, die die Zahl von Algorithmen verfasster Inhalte weiter wachsen lassen wird: “Do-it-yourself-Robotjournalism“.

Zur Zeit überwiegt noch das Projektgeschäft: ein Dienstleister in dem Bereich Computertexte bekommt einen mehr oder weniger klar definierten inhaltlichen Wunsch, das Entwicklerteam schliesst sich für mehrere Wochen ein und am Ende bekommt der Kunde schlüsselfertige Inhalte, die nur noch in das ContentManagementSystem integriert werden müssen. Oder die gleich auf einer Seite des Kunden veröffentlicht werden. Der Vorteil: bis die Inhalte publikationsfähig sind hat der Kunde keinen bis geringen zeitlichen und personellen Aufwand. Der Nachteil: die Abhängigkeit von dem Inhaltelieferanten als Dienstleister liegt bei 100%. Das gilt besonders für alle Änderungen und Ergänzungen, die als Sonderwunsch bezahlt werden müssen. Eigenes Knowhow wird nur sehr wenig aufgebaut.

Immer stärker holt jetzt “AutomatedContentSoftware” auf, bei denen der Kunde selbst mit einer Standardsoftware Inhalte aus Daten schafft. Diese Möglichkeit wurde vor gar nicht solanger Zeit noch belächelt, weil es kaum vorstellbar schien, dass sich Redaktionen die Zeit nehmen, selbst an der Wort- und Textqualität einer Automatisierungssoftware zu “schrauben”. Inzwischen arbeiten bereits renommierte Großverlage daran, mit einer solchen Basissoftware eigene, automatisch erstellte Inhalte zu schaffen. Noch gibt es die typischen Unzulänglichkeiten einer neuartigen Softwaregeneration, aber der Wunsch, dieses Werkzeug in der eigenen Redaktionen unter der eigenen Hoheit zu haben, löst derzeit eine erhebliche Nachfrage aus.

90% aller Nachrichten werden im Jahr 2022 automatisch erstellt sein – die BBC dürfte mit dieser Prognose Recht behalten. Denn auch Pferdeportale werden aus ihren bis zu 40.000 Einzelportraits prominenter Vierbeiner, die bislang oft nur als “Datenblatt” existieren, gerne Texte machen lassen, die sich dann auch noch mit jedem gewonnenen Wettkampf automatisch aktualisieren.

Von der Geheimwissenschaft zum Standard: Roboterjournalismus

zwei roboterhände auf tastatur

Nach einer kleinen Rundreise und Besuche bei fast allen Anbietern von automatisierten Texten diese kurze, stichwortartige Zusammenfassung zum Stand des automatisierten Contents:

• Die drei klassischen Anwendungsgebiete Wetter, Börse/Finanzdaten und eventreiche Mannschaftssportarten werden allesamt ab Beginn 2017 in allen Sprachen in hoher Qualität umfangreich als automated content angeboten werden

• Die Zahl der Nachrichten wird – so auch die BBC – extrem zunehmen, der Gesamtanteil der automatisch generierten Nachrichten an allen News wird auf 90% steigen (News für kleine Zielgruppen, special interest, vielfältige Sprach- und Formatversionen führen zu dieser Vergrößerung des Nachrichtenangebotes)

• Reuters, Bloomberg und zwei große Finanzportale arbeiten bereits an mehrsprachigen Finanz-Angeboten, die auf ohnehin vorhandenen Daten basieren: die Portale werden die Inhalte zumindest zunächst als Marketing/SEO-Maßnahme kostenlos anbieten, die Wirtschaftsnachrichtenagenturen werden ihr Webfeed-Angebot damit massiv ausbauen. Erwarteter Launch: Jahresbeginn 2018.

• Die Differenzierung der Angebote wird keine textbezogene mehr sein, sondern sich am Anspruch der Dateninterpretation messen: wie viele historische Daten oder sekundenaktuelle Vergleiche werden in den Text integriert, um diesen dramaturgisch hochwertig zu machen und etwas zu bieten, was der menschliche Redakteur nicht oder nur mit extremen zeitlichen Aufwand schreiben könnte

• Erst ab Ende 2017/2018 wird man artificial intelligence sinnvoll einsetzen können: zunächst werden Softwares die exakte Tonalität eines Kundenmediums selbsttätig lernen, ab 2019 wird die Software selbststätig Datenquellen durchsuchen und entscheiden können, ob die Inhalte genug für eine interessante Geschichte hergeben oder nicht

Medienhäuser haben die Möglichkeiten bislang nicht erkannt: in aller Regel gibt es kaum einen Überblick darüber, welche Daten im Haus verfügbar wären und welche Inhalte man daraus generieren könnte

• Die US-Unternehmen narrative science und automated insights haben mit ersten Kundenprojekten in der DACH-Region begonnen und bauen weiter aus

• Die Entwicklungskosten sind im freien Fall: die Entwicklung einer Textgenerierungsanwendung wie die für das „Handelsblatt“ (15minütige Vertextlichung von Tec-,S- und MDax) wurden vor 2 Jahren noch mit immerhin 200Teur kalkuliert. Heute würde die Entwicklung der noch relativ einfachen Anwendung mit höherer Textqualität in einer Sprache maximal 50-75Teur kosten, die Kosten sind um rund 75% gefallen

• Die Kostenfalle für die Anbieter kann nur durch die Konzentration auf Premiuminhalte durchbrochen werden: die maximale Zahlungsbereitschaft je Artikel liegt im Börsenbereich bei 0,75Eur bis maximal 1,50Eur, je nach Vermarktungsansatz. Eine Integration relativ einfacher Börsen- Sport- oder personalisierter Wetterberichte in payed content-Bereiche von Medienkunden funktioniert aber nur, wenn die Inhalte einen extrem hohen Mehrwert für die User oder payed newsletter Empfänger bieten. Einfache, aber gut lesbare Textangebote wird es in einem Jahr schon für rund 20 Cent/Artikel geben.