Category Archives: Sonstiges

Von der Geheimwissenschaft zum Standard: Roboterjournalismus

zwei roboterhände auf tastatur

Nach einer kleinen Rundreise und Besuche bei fast allen Anbietern von automatisierten Texten diese kurze, stichwortartige Zusammenfassung zum Stand des automatisierten Contents:

• Die drei klassischen Anwendungsgebiete Wetter, Börse/Finanzdaten und eventreiche Mannschaftssportarten werden allesamt ab Beginn 2017 in allen Sprachen in hoher Qualität umfangreich als automated content angeboten werden

• Die Zahl der Nachrichten wird – so auch die BBC – extrem zunehmen, der Gesamtanteil der automatisch generierten Nachrichten an allen News wird auf 90% steigen (News für kleine Zielgruppen, special interest, vielfältige Sprach- und Formatversionen führen zu dieser Vergrößerung des Nachrichtenangebotes)

• Reuters, Bloomberg und zwei große Finanzportale arbeiten bereits an mehrsprachigen Finanz-Angeboten, die auf ohnehin vorhandenen Daten basieren: die Portale werden die Inhalte zumindest zunächst als Marketing/SEO-Maßnahme kostenlos anbieten, die Wirtschaftsnachrichtenagenturen werden ihr Webfeed-Angebot damit massiv ausbauen. Erwarteter Launch: Jahresbeginn 2018.

• Die Differenzierung der Angebote wird keine textbezogene mehr sein, sondern sich am Anspruch der Dateninterpretation messen: wie viele historische Daten oder sekundenaktuelle Vergleiche werden in den Text integriert, um diesen dramaturgisch hochwertig zu machen und etwas zu bieten, was der menschliche Redakteur nicht oder nur mit extremen zeitlichen Aufwand schreiben könnte

• Erst ab Ende 2017/2018 wird man artificial intelligence sinnvoll einsetzen können: zunächst werden Softwares die exakte Tonalität eines Kundenmediums selbsttätig lernen, ab 2019 wird die Software selbststätig Datenquellen durchsuchen und entscheiden können, ob die Inhalte genug für eine interessante Geschichte hergeben oder nicht

Medienhäuser haben die Möglichkeiten bislang nicht erkannt: in aller Regel gibt es kaum einen Überblick darüber, welche Daten im Haus verfügbar wären und welche Inhalte man daraus generieren könnte

• Die US-Unternehmen narrative science und automated insights haben mit ersten Kundenprojekten in der DACH-Region begonnen und bauen weiter aus

• Die Entwicklungskosten sind im freien Fall: die Entwicklung einer Textgenerierungsanwendung wie die für das „Handelsblatt“ (15minütige Vertextlichung von Tec-,S- und MDax) wurden vor 2 Jahren noch mit immerhin 200Teur kalkuliert. Heute würde die Entwicklung der noch relativ einfachen Anwendung mit höherer Textqualität in einer Sprache maximal 50-75Teur kosten, die Kosten sind um rund 75% gefallen

• Die Kostenfalle für die Anbieter kann nur durch die Konzentration auf Premiuminhalte durchbrochen werden: die maximale Zahlungsbereitschaft je Artikel liegt im Börsenbereich bei 0,75Eur bis maximal 1,50Eur, je nach Vermarktungsansatz. Eine Integration relativ einfacher Börsen- Sport- oder personalisierter Wetterberichte in payed content-Bereiche von Medienkunden funktioniert aber nur, wenn die Inhalte einen extrem hohen Mehrwert für die User oder payed newsletter Empfänger bieten. Einfache, aber gut lesbare Textangebote wird es in einem Jahr schon für rund 20 Cent/Artikel geben.

News about robot journalism at the global magazine conference in London

roboter am schreibtisch

A BBC report on the future of news, published a few months ago, concluded that within 10 years 90 per cent of all news will be automated and written by software. The story ignited a debate the role of so called ‘robot journalists’ and whether they would put their human counterparts out of jobs. Someone who is excited about the potential of automated journalism, and sees it as complimentary to what humans create is Wolfgang Zehrt, founder and CEO of Data Driven News Agency Germany, who spoke at the FIPP magazine publisher conference in London this week #London.

He predicts that the BBC is right and that a huge amount amount of content in the future will be automated, but that it will be of a certain type and in certain sectors. In his presentation at FIPP London he began by stressing how important data has become to the media.

Wolfgang argues that there is now so much data being created and that software can unpick it much faster and more effectively than humans. Computers are also running all of the time and don’t need breaks like humans. Also the software can produce content in any language.

Wolfgang then delivered his four steps to automated content:

  • The first step is the identification of the data source. There are lots of unexplored data sources, for example data generated by elections and also regional data that is never published.
  • The second step is getting data on board – building a data interface – and then using this to see if there is a story that can be developed.
  • Thirdly building a data model – the integration of important facts, what does the publishing software need to look for?
  • Finally generating the text – this is only 20 per cent of the work and costs are coming down. As Wolfgang explains ‘it is not a miracle any more.”

Wolfgang then ran through some of the scenarios in which automated content can be used today. He said that key areas are sports reports, weather, finance and traffic. Sometimes the two data sources can be combined to find stories – such as traffic and weather.

Wolfgang then talked about how important soccer is to automated content. His company has recently done a large deal to create soccer reports from media companies including, for the first time, print media.

“Football generates lots of incoming data,” he added. “The hard bit is finding out what is important and then using the software to look at data and write an article about the game with the most interesting focus.

Another area where Wolfgang thinks automated content can play an important role in the near future is in the car industry. Data such as ‘which is the best seller?’ ‘what has the most resale value?’ ‘who is buying the car?’ can create fascinating stories which can be used by content marketers as well.

Finally Wolfgang concluded by saying the content could be “published on all platforms directly. The word count is irrelevant it can be 10 words or 2,000.”Also that from summer a completely automated news portal, the first of its kind, is to be produced in Germany.