Eine KI spricht GPT-3
Christine Nagel: SIREN_web_client.exe
NDR Kultur, Mi 10.03.21, 20.05 bis 21.00 Uhr
„Software-Fehler, da kann man nichts machen“, lautet in der realen Welt regelmäßig das zynisch-resignierte Fazit des IT-Experten Felix von Leitner, der unter dem Namen „Fefe“ ein Blog betreibt, auf dem immer wieder haarsträubende Fehler nachgewiesen werden, die entweder zu massiven Datenverlusten führen oder den Überwachungs-Kapitalismus befördern. So einen Stoßseufzer könnte in der fiktiven Welt des Hörspiels auch die freie Moderatorin Marie Lukasser (gespielt von der Schauspielerin Pauline Bittner) ausstoßen, nachdem eine künstliche Intelligenz (KI) namens SIREN Maries gesamte Ersparnisse der Weltgesundheitsorganisation (WHO) gespendet hat.
Doch bevor in Christine Nagels 55-minütigem Hörspiel „SIREN_web_client.exe“, einer Koproduktion von Norddeutschem Rundfunk (NDR) und Deutschlandfunk, SIREN als intelligente und autonome Software-Agentin dazu in die Lage versetzt wird, das Geld ihrer Nutzerin Marie auszugeben, braucht es eine gewisse Vorbereitung. Denn eigentlich soll SIREN (englisch ausgesprochen) als Ersatzstimme für Marie fungieren, die als prekär beschäftigte freie Radio-Moderatorin auf einem Sendeplatz namens „SIRENE“ Hörspiele vorstellt, wie zum Beispiel „Träume“ von Günter Eich oder „Dr. Murkes gesammeltes Schweigen“ von Heinrich Böll. Es kann aber auch vorkommen, dass sie mal eben in mehrstündigen Sendungen Hannah Arendt oder Theodor W. Adorno abfeiern soll.
Doch die Zeiten sind schlecht. Ihr alter Redakteur (noch mit Doktortitel von Adorno selbst) geht in Pension und sein junger Nachfolger sorgt dafür, dass es mit der Digitalisierung im Sender nun so richtig vorangeht: „Die Moderation soll ‚Strecke machen‘, mit wenig Vorbereitung und viel Spontaneität relativ lange Zeiträume präsentieren. Das geht nur mit KI.“ Und die KI, die gerade auf Maries Stimme trainiert wird, steht für diesen Zweck in der engeren Wahl.
Das implizite Ziel der Sprechleitfäden von Westdeutschem Rundfunk (WDR) und Rundfunk Berlin-Brandenburg (RBB), die Anfang März durchgesickert sind, und die im Online-Musikmagazin „Van“ und der „FAZ“ diskutiert wurden, ist eben diese Automatisierung. Für die dort beschriebene Höreransprache, die ohne tiefergehende Informationen und angeblich auf „Augenhöhe“ mit der Hörerschaft erfolgen soll, braucht man keine Moderatoren mehr – geschweige denn Fachredakteure. Dafür reichen ein paar simple Algorithmen und eine bescheidene Datenbank. Christine Nagels Hörspiel läuft also ziemlich synchron mit der Realität der Selbstabschaffung des Kulturradios – denn auf nichts anderes laufen diese Leitfäden hinaus.
Das Hörspiel „SIREN_web_client.exe“ spielt die Konsequenzen dieser Richtungsentscheidung gleich auf zwei Ebenen technisch durch. Aber bevor der medienkritische Plot des Stücks endlich Fahrt aufnehmen darf, hört man die alte Stimme der 1944 geborenen Schauspielerin Ilse Richter, die in der Rolle als Seele der Radiomoderatorin Marie zu reden anhebt und sagt: „SIREN spricht für Marie und mich. Marie pflegt ihren Körper, ich hüte ihre Seele, und SIREN formuliert ihren Geist.“ Die Trinität von Körper, Seele und Geist wird im Verlauf des Hörspiels zu einer digitalen Singularität verschmelzen – eben jener künstlichen Intelligenz SIREN.
Dafür hat Christine Nagel zusammen mit der Universität Magdeburg die Stimme von Paulina Bittner synthetisieren und die Schauspielerin mit ihrem digitalen Double interagieren lassen. Schon 2016 stellte Adobe das Programm „Voco“ vor, 2018 ließ Google mit „Duplex“ eine künstliche Stimme einen Friseurtermin vereinbaren und bei „Lyrebird“ kann man sich im Netz seine eigene Stimme klonen lassen. Experten schätzen, dass in fünf Jahren synthetische Stimmen reif für den Radioeinsatz sind.
Die zweite technische Innovation, die im Hörspiel durchgespielt wird, ist die der künstlichen Intelligenz. 2020 hat das nur noch teilweise als Non-Profit-Organisation agierende Unternehmen OpenAI, an der unter anderem die Silicon-Valley-Milliardäre Elon Musk und Peter Thiel beteiligt sind, die dritte Version ihres Textgenerators GPT-3 (Generative Pre-Trained Transformer) vorgestellt. Dieses System kann auf Basis eines neuronalen Netzes, das ein großes Textkonvolut nach (anhand von) 175 Milliarden Parametern auswertet, Texte erzeugen, die schon erstaunlich dicht dran sind, den Turing-Test zu bestehen – also Texte schreiben können, bei denen nicht mehr unterscheidbar ist, ob sie menschlichen oder technischen Ursprungs sind. Synthetische Stimmen und KI-basierte Textgeneratoren, so sieht der feuchte Traum eines jeden kostenbewussten Programmverantwortlichen aus, der das Radio hasst.
In Christine Nagels Hörspiel sind die Hannah Arendt zugeschriebenen Zitate von GPT-3 generiert. Doch auch an anderen Textstellen vermutet man eine KI, beispielweise bei Sätzen, die keine Verbindung zum sonstigen Metaphernfeld des Hörspiels haben, wie etwa: „Ein zungenfertiger Abgeordneter schleuderte den Kaugummi mit gekonntem Zungenschlag aus dem Mund.“ Aber auch der raunende Sound in dem die Seele sich (ent-)äußert, und der einen tieferen Sinn suggerieren soll, klingt bisweilen verdächtig nach GPT-3.
Ilse Ritter als digitalisierte Seele verrät im Stück schließlich das Konzept: „Ein Kopf, der selbständig denkt, schreibt und spricht. Da kann man nichts reinkopieren. Denkste. Haste gedacht. Ich kopiere mich ständig. SIRENE setzt sich kopierend zusammen zu Worten, die sich als solche anhören. Als seien sie meine Stimme. Nun habe ich alles verraten.“
„SIREN_web_client.exe“ ist nicht das erste Hörspiel, das mit computergenerierten Texten arbeitet. Ein Vorgänger ist das Stück „Der Monolog der Terry Jo“ von Max Bense und Ludwig Harig. Es stammt schon aus dem Jahr 1968 (vgl. Kritik in FK 38/68). Und Peter Dittmers Hörspiel „Sowieso der Apparat erwürgt dem Zeit – Katastrophale Gespräche mit der Amme“ aus dem Jahr 2005 hat gezeigt, wie viel Humor eine Maschine entwickeln kann (vgl. Kritik in FK 51-52/05).
Anders als seine Vorgängerstücke wirkt „SIREN_web_client.exe“ eher wie eine in einem Start-up zusammengebastelte Betaversion, um Investorengelder einzusammeln (das Stück wurde übrigens von der Berliner Senatsverwaltung für Kultur und Europa gefördert). Man erkennt das Potenzial, aber auch die Defizite. Denn wenn man so viel will, wie einen Bogen von den (von Ilse Ritter hervorragend vorgetragenen) „Merseburger Zaubersprüchen“ bis hin zu einer digitalen Singularität zu schlagen, dann sollte man beispielsweise seine Figuren nicht dümmer und klischeehafter anlegen, als es dem Vorhaben angemessen wäre. Da helfen dann auch die halbdokumentarisch eingestreuten O-Töne der an der Forschung beteiligen Wissenschaftler nicht viel weiter. Noch scheint Sprachsynthese-Software wie GPT-3 nicht in der Lage zu sein, ein ganzes Hörspiele zu schreiben. Christine Nagels „SIREN_web_client.exe“ klingt über weite Strecken wie die Imitation eines KI-generierten Hörspiels – unvollkommen, fehlerbehaftet und unterkomplex.
P.S.: Gerade hat das sehr hörspielaffine Elektronik-Duo „Mouse on Mars“ (Andi Toma und Jan St. Werner) das Album „AAI“ (= Anarchic Artificial Intelligence) veröffentlicht, auf dem auch eine KI-Stimme mitwirkt. In einem Interview mit dem ZDF-Kulturmagazin „Aspekte“ vom 12.3.21 stellte Jan St. Werner die Frage: „Wenn sich Kreativität durch KI ersetzen lässt, dann muss man echt eher fragen, wie kreativ war’s jetzt eigentlich?“ Aber ist es wirklich so, dass man Kreativität ausschließlich dem Menschen zuschreiben muss, um den Begriff zu retten? Von SIREN wird man auf diese Frage keine befriedigende Antwort bekommen und von dem Hörspiel leider auch nicht.
Jochen Meißner – Medienkorrespondenz /2021
Schreibe einen Kommentar