Thema des Tages: Interview mit einem Klon

DER STANDARD DER STANDARD 9/29/23 - Episode Page - 33m - PDF Transcript

Dieser Podcast wird unterstützt von Yes, der Mobilfunk des Konter.

Ich bin Tobias Holub, das ist Thema des Tages, der Nachrichten-Podcast vom Standard.

Clips wie diesen findet man im Internet gerade sehr oft, wie die es oder Tonaufnahmen,

in denen die eigene Stimme in eine fremde Sprache übersetzt wird, per künstliche Intelligenz.

Kann KI also mittlerweile auch schon Stimmen von echten Menschen klonen und zwar täuschen echt?

Anzeichen gibt es dafür einige von betrügerischen Scam-Anrufen bis hin zu Streiks in Hollywood.

Wir schauen uns das Thema heute genauer an und haben im Selbsttest auch unsere eigenen Stimmen geklont.

Peter Zellinger, du bist Web-Redakteur hier beim Standard und erzählst mir heute etwas über

künstlich generierte Stimmen. Kann KI jetzt wirklich schon menschliche Stimmen nachmachen?

Das ist eine großartige Frage. KI-generierte Stimmen haben in den letzten Jahren erhebliche

Fortschritte gemacht, moderne Text-to-Speech-Systeme wie GPT 3.5 sind in der Lage,

menschenähnliche Stimmen zu erzeugen, die sich natürlicher anhören als je zuvor.

Gibt es eigentlich Anwendungen, bei denen solche generierten Stimmen jetzt schon erfolgreich

eingesetzt werden? Absolut. Zum Beispiel in der Unterhaltungsbranche finden KI generierte

Stimmen Anwendung, um Charakteren Leben einzuhauchen. Darüber hinaus werden sie vermehrt in der Barrierefreiheit

eingesetzt, um Menschen mit Seebehinderungen den Zugang zu gedruckten Informationen zu erleichtern.

Aber gibt es auch Bedenken oder Probleme, die wir bei diesen KI-generierten Stimmen im Auge

behalten sollten? Ja sicher. Mit dem zunehmenden Realismus von KI-generierten Stimmen müssen wir

uns auch ethische Fragen stellen. Die potenzielle Missbrauchsmöglichkeit für betrügerische Zwecke

ist eine Herausforderung. Auch Datenschutzbedenken sind relevant, da die Verwendung persönlicher

Daten zur Verbesserung solcher Systeme diskutiert wird. Es ist wichtig, diese Fragen zu beantworten,

während wir die Technologie weiter vorantreiben. Mit diesem schönen Schlusswort ist es jetzt aber auch

wieder an der Zeit, dass wir zu unseren menschlichen Stimmen zurückkehren. Herzlich willkommen im

Studio Peter Zellinger vom Web-Standard. Ja das S haben wir leider nicht so richtig hinbekommen,

danach Produktion. Aber surprise, surprise, man hat schon gemerkt, dass die letzten drei Fragen KI

generiert waren, nämlich vor allem auch unsere Stimmen KI-generiert waren und quasi geklont waren.

Wie hast du meine Stimme geklont? Ja das war eigentlich gar nicht so schwer, deine Stimme

zu klonen. Ich meine das Basismaterial haben wir ja zu genüge, also von dir gibt es ja ein paar

Stunden Audiumaterial. Das Ganze habe ich dann einfach in eine Software eingespielt von der

Firma 11 Labs und diese Software habe ich halt mit deiner Stimme trainiert. Ich glaube ihr

haben einfach aus deinen Nachrichten beiträgt ein paar Schnipel rausgenommen. Mit meiner Zustimmung,

das sage ich gleich mal dazu, was ist das für eine Software? Kostet ihr ein Geld,

kann die jeder und jeder einfach so verwenden, finden im Internet? Ja also die Software ist

aber frei verfügbar, wie gesagt, die wird von dieser Firma eben zur Verfügung gestellt. Damit

kann man in der Basisversion sich zum Beispiel von vorgefertigten Stimmentexte vorlesen lassen.

Das ist ganz nett, wenn ich einen Text habe und möchte mir den Vortragen lassen oder ich möchte

mir ein E-Book anhören und finde aber das E-Book dazu nicht, habe aber das Buch und möchte mir

das so was anhören, dass wir diese kostenlose Variante in der Bezahlvariante kann man auf das

Sprachlabor so nähnen, sie ist hochtrabend zugreifen. Das ist aber im Grunde nichts anderes als

ein Upload-Button, mit dem ich Audio Samples, also Audio Dateien hochladen kann, aus denen dann eine

KI-Stimme generiert wird. Dafür reichen mir schon fünf Minuten Material, recht viel mehr braucht

es da gar nicht. Die Kosten, ja die sind eher überschaubar, also die ganze Spaß hat uns jetzt

einen Euro gekostet und die Geschichte wäre eigentlich noch gratis gewesen, wäre die Firma

nicht vor ein paar Monaten normal in die Schlagzeilen geraten, als ihre Software dazu verwendet wurde,

die falsche Emma Watson aus Hitlers Mein Kampf vorlesen zu lassen. Auch das müssen wir gleich

noch ausführlich besprechen, aber das heißt je mehr man dafür Abos und so weiter zahlt,

desto besser wird die Qualität von diesen generierten Sprachen teilweise auch noch, oder?

Ja, wobei wir uns da gar nicht so sicher sein können, wie viel besser es wirklich wird.

Ab einem gewissen Level bekommt man dann einfach eine bessere Audioqualität zur Verfügung gestellt.

Das Sprachmodell, das zu Grunde legende, wird jetzt nicht besser, man bekommt dann mehr Optionen,

dass man mehr Stimmen klonen kann, dass man mehr Stimmen benutzen kann. Aber im Grunde kommt man

mit der Basisversion schon sehr, sehr weit, wie man, glaube ich, ganz gut gehört hat.

Und es gibt aber das sicher auch noch andere Software-Anbieterinnen und Anbieter, oder?

Natürlich, mit dem ganzen KI-Hype kamen dann natürlich jede Menge Anbieter auf dem Markt,

da gibt es noch Speedchify, das ganz, ganz ähnlich funktioniert. Dann gibt es so kombinierte

Lösungen wie jene, die jetzt die Veral gegangen ist mit diesem Video, dieses Regisseurster auf

der Veranda da, plötzlich auf einmal Deutsch oder Französisch spricht, obwohl er diese Sprachen

gar nicht kennt. Ich glaube, das hat so ausgeschaut, dass ein Mann ein Video aufgenommen hat und da quasi

in Englisch gesprochen hat und das Video dann hochgeladen hat in diese App und die hat dann

alles, was er gesagt hat, auf Französisch oder Deutsch übersetzt. Also habe ich nichts Besonderes

zu sagen, aber hoffentlich funktioniert das gut und macht einige wirklich coole Übersetzungsausschnitte.

Da gehen wir. D'accord. Donc apparemant, c'est un traducteur vocale qui est glissé déposé.

Noch das spannende daran, was man jetzt natürlich nicht sieht bei dieser Aufnahme davon. Auf dem

Video waren auch die Lippenbewegungen dann passen zu der anderen Sprache, also auch das Video ist

per KI verändert worden. Exaktement. C'était du Français en synchronisation labial. La traduction

était boff. L'animation des Lèvres était aussi eh bien, assez bien. La voix elle-même était

aussi correct, mais on voix et bien nous progressons déjà dans la technologie.

So, haben wir das auch ausprobiert. Jetzt nochmal auf Deutsch bitte. Genau, das war dann Lippen synchrone

französisch. Die Übersetzung war naio. Die Animation der Lippen war auch ganz ok. Die Stimme

selber war auch ok, aber man sieht, man bekommt auch schon weiter in der Technologie. Ich finde,

bei dir hat das schon ganz gut geklungen, soweit ich mit meinen wenig ausgeprägten

französisch Kenntnissen das beurteilen kann. Du hast gerade schon gesagt, KI-Hype, wir brauchen

noch einen letzten Disclaimer für unseren kleinen Selbsttest, den wir versucht haben. Wir

wollten nämlich probieren, ob nicht der gesamte Content von so einem Podcast-Einstieg künstlich

generiert werden kann. Deswegen habe ich dann auch den Text, so eine Art Textvorlage für das,

was da gesagt worden ist, von ChatGPT noch generieren lassen mit einem kleinen Prompt. Ich

habe dir die Texte dann rüber geschickt. Wie war denn jetzt so die Qualität von diesen Texten?

War jetzt das inhaltlich für dich nachvollziehbar? Ja, also die Texte von ChatGPT sind ja mittlerweile

allgegenwärtig und so ein Intro ist ja jetzt auch kein großes Problem für diesen Chatbot. Man

muss auch alle Angaben genau prüfen und die Antworten sind halt oft ein bisschen banal. Und

ich muss auch dazu sagen, jetzt so von den Formulierungen, die das Programm da ausgespuckt

hat, wir haben ein bisschen umgeschrieben, damit es nicht ganz so künstlich klingt. Und wenn wir

dann noch ein bisschen mehr umformuliert hätten, dann wären vielleicht auch diese künstlichen

Stimmen besser rübergekommen, weil einfach die Sätze nicht zu merkwürdig gewesen wären,

wie das jetzt teilweise der Fall war. Ja, wir haben sie schon noch ein bisschen vermenschlicht,

aber ich glaube, so ganz gelungen ist es uns noch nicht. Noch nicht. Wie ist denn jetzt dein

Fazit? Du lässt immer anklingen, du findest, dass wir diese Stimmen jetzt schon klingen von diesen

Programmen relativ gut, relativ realitätsnah. Würdest du also sagen, dass diese Text-to-Speech-Programme

jetzt wirklich schon täuschend echte Menschenstimmen nachmachen können von echten Personen?

Also, restlos überzeugt bin ich jetzt noch nicht. Also, wie man jetzt gehört hat, ich finde, deine

Stimme ist ganz gut getroffen. Ich klang ein bisschen wie ein Deutscher. Kann man jetzt halten

davon, was man will. Das ist halt sicher jetzt auch unseren Zuhörerinnen und Zuhörer aufgefallen,

dass halt die Software da schon noch ein bisschen was braucht und sich vor allem mit so ein bisschen

ostösterreichischer Akzent ein bisschen schwer tut. Ich bin mir aber ziemlich sicher, dass sich das

in der nächsten Zeit ganz, ganz schnell ändern wird. Vor allem im US-Raum ist das schon bereits so,

die meisten dieser Modelle werden ja auf US-amerikanische Sprecher trainiert und da kann

man jetzt schon verschiedene Dialekte einstellen. Da kann man jetzt schon die Stimme auch künstlich

altern lassen. Also, man kann aus einem jungen Menschen einen alten Menschen machen, aber die

Stimmqualität, also die wird bei uns jetzt das sicher noch einmal deutlich besser und wir haben

es jetzt auch bei uns gesehen. Wenn wir lockerer gesprochen haben, ich glaube bei dir haben wir

eine eher locker gesprochen, eine Soundfile dann noch mal hochgeladen. Das Ergebnis ist

noch einmal viel authentischer geworden. Ich glaube, ein bisschen braucht man noch, aber es wird

und es wird dann schnell gehen, glaube ich. Ich muss dazusagen, ich war jetzt noch nicht so ganz

überzeugt von dem Ergebnis. Ich habe tatsächlich dich näher am echten Peter gefunden als mich,

weil man dazusagen muss, jetzt abgesehen von Dialekten und so weiter, dass wir da ein bisschen

Hochdeutsch klingen, auch so Sachen wie das Fragen am Ende einfach nicht wie eine Frage klingen. Dann

war es teilweise so, dass am Ende von diesen Fragen dieses Programm noch mal so einen Atem

eingefügt hat, was ja alles künstlich generiert ist, nur in dem Fall halt an einer falschen

Stelle noch mal einen Atem eingefügt. Also, da ist sicher noch ein bisschen Arbeit zu machen. Vor

allem auch nämlich, was mir als erstes aufgefallen ist, der Standard, wo wir es, glaube ich,

einfach nicht geschafft haben, das Programm dazu zu bringen, Standard zu sagen. Ja, ich glaube,

in einer Version ist es uns gelungen, die klang aber insgesamt sonst sehr furchtbar. Wir wissen halt

nicht, wie diese Software im Hintergrund tatsächlich arbeitet, was dafür Prozesse am

Werken sind. Das kannst du halt nie sagen. Und wenn du einen Satz dreimal generierst,

also drei unterschiedliche Ergebnisse, da war es natürlich auch ein bisschen in der Natur der

Sache liegt. Weil man auch diesen Algorithmus im Hintergrund eben als Kundin und Kunde nicht ganz

durchschauen kann. Aber jetzt hast du gesagt, diese Programme sind zumindest in englischer Sprache,

teilweise schon fortgeschrittener als in deutscher Sprache. Gibt es da jetzt schon Einsatzzwecke,

wo das aktuell wirklich schon zum Einsatz kommt, wo Menschen wie du und ich das für was Sinnvolles

verwenden können, außer dass wir einen Podcast produzieren? Ja, also die erste Anwendung,

ich habe sie schon mal kurz erwähnt, ist halt die Form auch von Screenreadern. Diese Technik ist

jetzt nicht neu. Das ist vor allem für sie behinderte Menschen wichtig, die einen Computer

bedienen wollen. Die werden halt dann die Fensterinhalte vorgelesen. Das gibt es auch bei uns auf

der Standard-Homepage. Man kann sich ja die Artikel auch vorlesen lassen. Das hat jetzt natürlich

die Möglichkeit, dass die nicht mehr so künstlich klingen. Früher waren das wirklich so abgehackte,

blechene Roboterstimmen. Nun kann man eventuell, weiß ich nicht, wenn man darauf steht, sich von

Russell Crow die Nachrichten vorlesen lassen in der Früh. Noch nicht beim Standard, aber das wird

schon noch. Vielleicht. Dann gibt es natürlich noch die Möglichkeit, dass man sich ein Audiobook

quasi selbst macht, indem man zum Beispiel den Inhalt von seinem E-Book-Reader, von seinem Kindle

nimmt, in die Software rein spielt und mit einer vorgefertigten Stimme sich das vorlesen lässt.

Ist wahrscheinlich zum Einschlafen oder zum Hören unterwegs, vielleicht keine so schlechte Idee.

Ein anderer Anwendungszweck, der mir jetzt bei David und diesem Podcast wieder aufgefallen ist,

Korrektur lesen, ist super, weil die KI über jeden Buchstaben drehen und über jedes

falsch gesetzte Satzzeichen einfach drüber stolpert und dir das sofort auffällt, wenn da was nicht

stimmt, ist mir jetzt auch in der Vorbereitung aufgefallen und sie findet wirklich jeden Fehler,

weil sich das sofort aus dem Textfluss und aus dem Hören rausreißt.

Ja, und dann, wieso immer, wenn etwas im Internet stattfindet, sind aber die anderen die

Bösenbuben immer ein bisschen schneller, ne?

Über die Bösenbuben reden wir gleich noch.

Wie können wir die Erderhitzung stoppen?

Wie verändert künstliche Intelligenz unser Leben?

Und wann wird nachhaltiges Reisen endlich einfacher?

Um diese und viele weitere Themen geht es im Podcast Edition Zukunft und Edition Zukunft Klimafragen.

Ich bin Alicia Prager und ich bin Jula Bayer.

Wir sprechen über Lösungen für das Leben und die Welt von morgen.

Jeden Freitag gibt es eine neue Folge überall, wo es Podcasts gibt.

Peter, du hast es schon ein paar Mal angesprochen.

Ich habe mich an das Stichwort Emma Watson erinnert.

Mit solchen Stimmgeneratoren kann man auch Schindluder treiben.

Was hat es da bisher schon gegeben?

Ja, die Software, die wir heute verwendet haben, die habe ich nicht zufällig ausgewählt,

sondern es ist genau jene Software, die schon für einiges Kandale gesorgt hat.

Es sind im Stimmaufnahmen von der angeblichen Emma Watson aufgetaucht,

die in einem Online-Forum aus Hitlers Mein Kampf vorgelesen hat.

Dann gab es den Fall des Spieldesigners Todd Howard, die Gamer unter euch werden ihn kennen.

Der wurde ebenfalls täuschend echt nachgeahmt und hat dann in einem Online-Forum versprochen,

dass in seinem neuen Spiel Starfield Pornofeatures mit drinnen sein werden.

Gut, dem Todd Howard wird es jetzt eher wurscht sein, der wird sich hier über die Werbung gefreut haben.

Das Problem sind jetzt aktuell eher Scam-Anrufe und Bedrucksversuche.

Das gab es in Deutschland jetzt schon relativ häufig.

Da reicht aber die Software noch nicht ganz für so einen kompletten Telefonanruf.

Meistens funktioniert das so.

Man wird angerufen, es ist die Stimme eines bekannten, der Tochter oder des Sohnes am Apparat,

die so ein bisschen weinerlich klingt und die dann sagt, Mama, Papa, ich hatte einen Unfall.

Ich gebe dir jetzt die Polizei.

Daraufhin ist auf der anderen Seite ein Betruger am Telefon, der sich immer als Polizist ausgibt

und so mit dieser Überrumpelungstaktik versuchen sie,

das so ein bisschen die Nachzelle der Technologie zu verschleiern,

weil um ein echtes Gespräch zu simulieren, da reicht das Tempo jetzt einfach nicht.

Wir haben unser Frage-Antwort-Spiel am Anfang auch aus mehreren Dateien,

die wir vorher erstellt haben, zusammengeschnitten.

Ein wirklich flüssiges Gespräch, das sind die Rechenkapazitäten einfach noch zu langsam,

aber wer weiß, was dann noch kommt.

Hallo Alex, ich habe ein Problem, kannst du mir kurz helfen?

Ha ha ha ha.

Mein Laptop wurde gehackt und die Hacker verlangen fünf Bitcoin

und meine Daten nicht zu veröffentlichen, kannst du mir die schicken?

Ja, schicke ich dir.

Danke für die Hilfe, Alex, auf Wiederhören.

Gerne, ciao.

Also sehe ich das richtig, dass du nicht auf meine KI-Stimme reingefallen bist

und mir keine fünf Bitcoin schicken wirst?

Nein, nicht wirklich.

Woran hat es gelegen?

Also nachdem ich dich schon ein bisschen kenne, hat es für mich schon sehr mechanisch geblungen,

aber ich wusste natürlich, dass du zu dem Thema recherchierst,

also vielleicht war ich da schon vorgewarnt.

Na gut, falsche Person ausgesucht zu meinem Scam.

Trotzdem, danke, dass du versuchst, kann ich nicht eingespielt hast mit mir.

Unfreiwillig.

Ciao, ciao.

Bis dann, tschüss.

Peter, zurück zu dir.

Also den Kollegen Alexander Amon aus deinem Web-Ressort konnten wir nicht reinlegen

mit unserem kleinen Scam, aber diese Betrugsmaschen generell,

die könnten schon noch um einiges schlimmer sein, oder?

Das denkt da zum Beispiel auch an so Politikerinnenstimmen.

Es gibt ja zum Beispiel eine Aufnahme von Donald Trump,

der nach Wahlstimmen sucht nach der verlorenen Wahl in den USA vor einigen Jahren.

Könnte man da nicht zum Beispiel auch die Stimme von Vladimir Putin klonen

und die Atomcoats aus einem russischen General irgendwie rauskitzeln?

Könnte das nicht gefährlich werden irgendwann mal?

Ja, wobei die Fälle, die bis jetzt bei Politikern aufgetreten sind,

sind eine recht schnell als fakes entlarvt.

Und sie sind auch aktuell wirklich noch nicht so gut,

dass sie wirklich so hundertprozentig täuschend echt sind.

Das ist bislang immer noch gut ausgegangen, formulieren wir es mal so.

Gefährlicher sind eher Falschmeldungen.

Es gab da den Fall aus China, wo TikTok überschwemmt worden ist

mit gefälschten Nachrichtensendungen,

die Propaganda im Sinne der Cup in China verbreitet haben.

Und auf diesem Level, auf einem niedrigschwelligeren Level,

glaube ich, ist die Gefahr deutlich größer als in der hohen Politik.

Gibt es irgendwas Bestimmtes, auf das ich achten kann,

wenn ich seine Stimme hört, mir unsicher bin?

Irgendwas Bestimmtes, an dem ich erkennen kann, ob das eine Fake-KI-Stimme ist?

Ja, noch, wir haben sie gehört, ist die Betonung und die Intonation

und auch die Betonung von Satzzeichen einfach noch nicht dort,

wo sie bei normalen Sprechern wäre.

Wenn man sich nicht sicher ist, ist es das Allerenfachste,

einfach mal bei dem Täter mal nachzufragen,

und zwar mit etwas, womit die nicht rechnen.

So, mit gesagt mir schnell, dein Geburtsjahr.

Oder wo waren wir vor zwei Jahren auf Urlaub?

So etwas kannst du in der Sekunde mit der KI nicht erstellen.

Und damit fällt das Ganze dann auch schon zusammen.

Und können Behörden oder vielleicht auch diese Technikkonzerne,

die diese Sprachmodelle, die diese KI-Systeme herstellen,

irgendwas machen und zu verhindern, dass da eben Schindler getrieben wird?

Ja, das ist im Prinzip die gleiche Diskussion,

wie wir sie vor einigen Monaten mit den KI-generierten Bildern geführt haben.

Damals gab es vor allem aus der Kunstszene einen Aufschreiben,

man könne ja nicht mehr von KI-generierter

oder echter menschlicher Kunst unterscheiden.

Und damals wurde eine Art Wasserzeichen

oder eine unsichtbare Markierung für KI-generierte Bilder gefordert.

Etwas Ähnliches gibt es auch für Sound-Dateien oder für KI-generierte Stimmen.

Eleven Labs, die Firma mit denen wir unsere Sound-Dateien erstellt haben,

arbeitet selber an so einer Software, die fakes erkennen kann.

Aber all diese Versuche sind erstens noch im Anfangsstadium.

Und zweitens, naja, womit verdienen die Software-Studios ihr Geld

mit dem Produkt einer KI-Stimme zu verkaufen?

Da ist die Gegenmaßnahme, naja, die wird jetzt nicht mit größtem Elan entwickelt,

sagen wir es mal so.

Andererseits gibt es in Österreich die Idee,

eine KI-Behörde zu installieren.

Die soll dann KI-generierte Inhalte markieren und solche ausweisen.

Ob das je funktioniert und wie genau das funktionieren könnte,

hat mir aber auch noch keiner schlüssig erklären können,

zumal wir in Österreich und auch in ganz Europa eigentlich

noch nicht einmal genau wissen, wie wir künstliche Intelligenz eigentlich überhaupt definieren.

Ist, weiß ich nicht, der Reiseplaner von der ÖBB,

ist das schon eine künstliche Intelligenz?

Wovon interessant ist der Vorschlagsalgorithmus von Instagram?

Eine künstliche Intelligenz, was wird markiert, wer wird markiert

und ich glaube jetzt nicht, dass die großen US-Konzerne da jetzt vor einer

österreichischen Behörde großzittern?

Was österreichische oder zumindest europäische Behörden aber vielleicht machen könnten,

ist eine rechtliche Situation schaffen, bzw. wie schaut die rechtliche Situation aus?

Darf eigentlich jemand, die Stimme von jemand anderem in so einem System laden,

darfst du meine Stimme nehmen und einen virtuellen Tobi aus mir bauen?

Ja, wie bei allen juristischen Fragen wird es da ein bisschen kompliziert

und weil ich auch kein Jurist bin, habe ich den Nikolas Vorguck gefragt,

der ist Professor an der Universität Wien und beschäftigt sich da ganz genau

mit dem Recht eben im digitalen Raum und der meinte,

dass es grundsätzlich kein Urheberrecht auf deine Stimme gibt.

Aber du hast ein geistiges Eigentum darauf, was du sagst.

Also was du sagst zum Beispiel in diesem Podcast, ist urheberrechtlich geschützt.

Das heißt, man darf jetzt eigentlich nicht hergehen, die Audio oder dein nehmen

und in eine KI Software hineinladen.

Der Rechtsexperte hat mir aber auch gesagt, dass es auch nichts nützt,

wenn ich jetzt deine Stimme nehme und so ein Bisshalveränder,

damit es halt nicht mehr deine Stimme ist,

weil rein rechtlich wird es entscheidend sein, ob eine Verwechslungsgefahr besteht.

Also deine Stimme jetzt eins zu eins zu klonen, das wird schwierig.

Die nächste Frage war natürlich, soll man versuchen,

von Seite des Gesetzgebers Betrugsversuche mit gestohlenen Stimmen zu verhindern?

Da meinte er, naja, da wäre es sehr vorsichtig dabei,

weil Betrug ist ja schon strafbar.

Die Methode dazu, ob die jetzt leichter oder schwerer ist,

ist dem Gesetzgeber egal, Betrug ist verboten.

Und wenn ich eine Stimme klonen kann und damit ein Betrug begehe,

das ändert ja am Strafrahmen nichts, nur weil ich die Möglichkeit habe,

eine neue Form des Betrugs quasi zu erfinden.

Okay, also zumindest was Betrugsversuche angeht,

ist unsere Rechtslage da schon vorbereitet, was die anderen Aspekte angeht,

vielleicht in den nächsten Jahren einfach noch viel Neues tun.

Ja, da bin ich mir ziemlich sicher.

Also in der Europäischen Union wird jetzt gerade an einem AI-Akt gearbeitet,

wo es erstmals auf diesem Planeten eine regulierungverkehrtige Systeme geben wird

und alle anderen Staaten schauen, dass wir ein bisschen hin, was die Europäer machen

und das wird dann wohl eine Vorlage für ein hoffentlich weltweites Regularium sein.

Schauen wir mal, die Chancen schauen derzeit nicht ganz schlecht aus.

Und wenn wir jetzt in die Zukunft von diesen Stimmgeneratoren

generell noch ein bisschen schauen,

Chadji Bedi hat es am Anfang eh schon angesprochen,

was denkst du denn, was so die Zukunftsbranchen sein werden,

in denen diese Systeme eingesetzt werden?

Man hat da zum Beispiel Hollywood gehört,

werden Schauspielerinnen in Zukunft virtuelle Stimmen haben,

werden dann vielleicht ganze Filme auf Dauer komplett künstlich werden?

Ja, das ist gerade eine Riesendebatte in Hollywood,

das ist ja auch mitunter einer der Gründe für den Streik,

dass der Einsatz von KI nicht eindeutig geregelt ist.

Wird es soweit kommen? Naja, es ist ja schon soweit.

Also die Stimme von Darth Vader zum Beispiel in den aktuellen Star Wars-Serien und Filmen,

die Stimme von James Old Jones wird zum Beispiel von einem Unternehmen aus der Ukraine

quasi künstlich am Leben erhalten.

Also das ist bitte eine Stimme, die wir alle kennen,

James Old Jones im Original in Englisch.

I am your father.

Und du wirst mir sagen, dass die neueren Serien und so weiter von Disney,

wo Darth Vader vorkommt, auch mit so einer KI-generierten Stimme gemacht wurden,

zum Beispiel in Kenobi.

The Grand Inquisitor means nothing.

Kenobi is all that matters now.

Is that understood?

Spannend. Was ist das für eine Firma, die diese Stimme nachstellt?

Respeecher heißen die und die haben sich darauf spezialisiert,

unter anderem auch die Stimme von Mark Hamill von Luke Skywalker

für die neuen Filmen wenig zu verjüngern,

weil er ist ja schon, glaube ich, in seinen 70ern

und er klingt halt anders, als er mit 30 oder so geklungen hat.

Das werden wir sehen, wir werden vermutlich mehr Prozesse sehen,

die mit KI-Unterstützung gemacht werden.

The Aging zum Beispiel ist ein Riesenthema,

wie ich einen älteren Schauspieler, Robert De Niro zum Beispiel,

in The Irish Man so jünger aussehen lasse.

Oder auch wieder, um das Beispiel Star Wars zu bringen,

selbst totischer Ausspieler kann ich da auch wieder aufstehen lassen.

Also da kommen noch ganz spannende Anwendungsfälle auf uns zu

und ich glaube, wir werden in einem halben Jahr schon über Dinge reden,

die wir jetzt noch für Science Fiction halten würden.

Bei diesen Streiks in Hollywood ist das ja mittlerweile teilweise

schon zu Einigungen gekommen, also da findet man langsam eine Lösung.

Aber jetzt verstehe ich auch, warum diese KI-Frage da so ein großes Thema war.

Aber abgesehen davon verstehe ich dich richtig,

auch wenn jetzt dieses Beispiel, das wir heute von uns beiden gehört haben,

noch nicht täuschend echt ist, du gehst davon aus,

dass es in einigen Monaten, Jahren wirklich solche Stimmgeneratoren geben wird,

wo man den Unterschied zur echten Person nicht mehr merken wird.

In Anbetracht der aktuellen Entwicklung würde ich eher von Monaten als Jahren ausgehen.

Dann Peter Zellinger, danke für diesen ein bisschen beunruhigenden,

aber spannenden Selbsttest an dich und dein virtuelles Doppel.

Sehr gerne, danke und gerne wieder.

Und wir machen jetzt dann gleich noch weiter mit unserer Meldungsübersicht.

Wir sprechen unter anderem über die neuesten Inflationszahlen

und über eine mörderische Uni.

Wenn Sie liebe Zuhörerinnen und Zuhörer, die journalistische Arbeit,

die wir hier beim Standard machen, unterstützen möchten,

dann geht das z.B. indem Sie ein Standard-Abo abschließen

und aktuell gibt es dafür auch spezielle Angebote,

weil der Standard sein 35.Jubiläum feiert.

Alle Infos finden Sie auf abo.standard.at.

Wir sind gleich wieder da.

Hörst du gern Musik?

Yes.

Und lustige Sprachnachrichten?

Yes.

Serien schaust du auch?

Yes.

Auch von unterwegs?

Yes.

Das verbraucht ganz schön viel Daten.

Yes.

Bei Yes gibt es jetzt statt 30 Gigabyte volle 50 Gigabyte um 9,99 Euro.

Was sagst du?

Yes.

Also, kein Stress?

Yes.

Kein Stress?

Yes.

Gibt es außerirdisches Leben?

Haben Tiere ein Bewusstsein?

Können wir durch die Zeit reisen?

Es gibt so viele große Fragen, die uns Menschen seit Jahrtausenden beschäftigen.

Aber erst jetzt kann die Wissenschaft Antworten daraus liefern.

Oder neue Rätsel entdecken?

Ich bin Tanja Traxler.

Und ich bin David Renert.

Im Standard-Podcast Rätsel der Wissenschaft gehen wir großen Fragen der Menschheit auf die Spur.

Wir fragen Wissenschaftlerinnen, was in Schwarzen Löchern passiert,

wo die Aliens bleiben

und die Fusionskraftwerke

und wo die Mathematik an ihre Grenzen stößt.

Rätsel der Wissenschaft geben wir auch eine neue Folge.

Überall, wo es Podcast gibt.

Und hier ist, was Sie heute sonst noch wissen müssen.

Erstens.

Im laufenden Jahr sind bereits mehr als 180 Taust Migrantinnen

übers Mittelmeer nach Europa gekommen.

Das berichten die Vereinten Nationen.

Mehr als die Hälfte davon ist demnach in Italien angekommen

und die Zahl der Verminsten und Toten liegt bei mehr als 2500.

In der Europäischen Union wird deshalb über ein Migrationspaket verhandelt.

Das ist aktuell auf den letzten Metern.

Knackpunkt ist die sogenannte Krisenverordnung.

Die soll Ausnahmefälle regeln,

wenn besonders viele Menschen ankommen und das reguläre System überlastet ist.

Deutschland hat sich lange gegen das System ausgesprochen,

vor kurzem aber eine Kompromisslösung akzeptiert.

Nun hat Italien aber noch eine Bedenkzeit erbeten,

bevor das Paket beschlossen werden kann.

Zweitens.

Die September-Inflation in Österreich liegt bei 6,1 Prozent.

Das ergibt eine neue Schnellschätzung der Statistikaustreher.

Im Vergleich zum Vormonat ist die Teuerung damit um mehr als 1 Prozent zurückgegangen.

Ein großer Grund für den Rückgang ist demnach die günstigere Haushaltsenergie,

wobei sich die Energiepreise auch sehr schnell wieder ändern können,

wie andere Statistiken zeigen.

Ein enormer Preistreiber sind aber jedenfalls die Lebensmittel.

Die Arbeiterkammer hat zum Beispiel erhoben,

dass Kartoffeln seit vergangenem Jahr um mehr als 40 Prozent teurer geworden sind.

Im Zweieres Vergleich gab es demnach sogar 80 Prozent Preisanstieg.

Laut ExpertInnen trifft das Menschen mit geringem Einkommen besonders hart,

denn wer sowieso schon das günstigste Produkt kauft,

hat bei Preisanstiegen keine Alternativen mehr

und muss mit weniger Nahrungsmitteln auskommen.

Im internationalen Vergleich hat Deutschland mit ähnlichen Preisanstiegen

bei Lebensmitteln zu kämpfen wie Österreich.

Die allgemeine Inflation liegt dort mit 4,5 Prozent, aber noch um einiges, geringer.

Und drittens, vor einigen Tagen wurden wieder die besten Unis der Welt gekürt,

im sogenannten Times Higher Education Ranking.

Für Österreich hat es die Uni Wien auf den 119. Platz geschafft

und ist damit die einzige österreichische Uni in den Top 200.

Auf Platz 1 des Rankings ist zum siebten Mal in Folge die britische Uni Oxford gelandet,

doch die hat eine dunkle Vergangenheit.

Oxford war schon im Mittelalter einer Universitätsstadt

und wer eine Forschungsgruppe festgestellt hat,

lag die Mordrate dort damals rund 50-mal höher als im restlichen Großbritannien.

Die meisten dieser Mordle wurden damals tatsächlich von Studierenden verübt

und wenn man weiß, dass früher das Mitführen von Schwärtern und Äxten

und enormer Alkoholkonsum auf der Tagesordnung gestanden sind,

dann ist das auch weniger überraschend.

Die konkreten Auslöser für die Morde waren dann aber doch wieder spannend.

In einem Fall zum Beispiel konnte festgestellt werden,

dass ein Student seine Kommilitoninnen durch Zitat 8-loses Urinieren zur Tat angestiftet hätte.

Erhoben hat diese Daten übrigens die ebenfalls britische Uni Cambridge

und dies dem Uni Ranking 4-Plätze hinter Oxford gelandet.

Alles Weitere zum aktuellen Weltgeschehen können Sie auf der Standardpunktarty nachlesen

und jetzt habe ich noch einen Hörtipp für Sie.

Liegt die Zukunft der Demokratie nicht in Wahlen,

sondern im zufälligen Auslosen von wichtigen Positionen im Land?

Und da braucht es vielleicht doch mehr Mitbestimmungsmöglichkeiten

für Menschen in einer Demokratie.

All diese Fragen haben sich meine Kollegen

in einem Standardpodcast-Edition Zukunft gestellt

und die Antworten hören Sie überall, wo es Podcasts gibt.

Falls Sie Feedback oder Anregungen für das Standardpodcast-Team haben,

dann schicken Sie gerne eine Mail an podcast.at

Und wenn Ihnen die heutige Folge gefallen hat,

dann abonnieren Sie uns am besten gleich in Ihrer liebsten Podcast-Plattform,

dann verpassen Sie auch keine weitere Folge von Thema des Tages.

Wir freuen uns auch sehr über gute Bewertungen oder nette Kommentare.

Vielen Dank dafür.

Danke auch an Schold Wilhelm und Peter Zellinger,

die an dieser Folge mitgearbeitet haben.

Ich bin Tobias Holop, danke Ihnen auch fürs Zuhören

und ein schönes Wochenende.

Reicht mein Gehalt für ein gutes Leben?

Sind Sneaker und Uhren ein gutes Investment?

Wie viel kostet eine Scheidung?

Das und vieles mehr sehen wir uns an.

In der dritten Staffel vom Standardpodcast lohnt sich das.

Wir, das sind Melanie Reidel,

Annika Dang, Alexander Amon und Michael Windisch.

Wir sprechen mit Expertinnen darüber,

wie man sogar vom Weltuntergang profitieren kann.

Und darüber, wie mich künstliche Intelligenz reich macht

und warum Geld noch immer Männersache ist.

Machine-generated transcript that may contain inaccuracies.

Künstliche Intelligenz kann die Stimmen echter Menschen nachmachen – und zwar immer besser. Was das für Hollywood und Scams bedeutet

Im Internet findet man Sie aktuell zuhauf: Videos, in denen die eigene Stimme innerhalb kürzester Zeit in eine fremde Sprache übersetzt wird – per künstlicher Intelligenz. Kann KI also mittlerweile auch schon die Stimmen von echten Menschen klonen, und zwar täuschend echt?

Anzeichen gibt es dafür einige: Von betrügerischen Scam-Anrufen bis hin zu Streiks in Hollywood, die unter anderem von der unsicheren Handhabung künstlicher Intelligenz ausgelöst wurden.

Im Podcast erklärt STANDARD-Webredakteur Peter Zellinger alles, was man zum Thema wissen muss, und macht im Stimmenklonen den Selbsttest.

Update,12:00 – der ursprüngliche Podcast wurde um aktuelle Meldungen ergänzt

Hat Ihnen dieser Podcast gefallen? Mit einem STANDARD-Abonnement können Sie unsere Arbeit unterstützen und mithelfen, Journalismus mit Haltung auch in Zukunft sicherzustellen. Alle Infos und Angebote gibt es hier: abo.derstandard.at