Lauschecke

Lauschecke
Hallo Leute,

in den letzten Jahren haben KI & Co. ja gewaltig zugenommen, was ihre Präsenz und auch ihre Fähigkeiten betrifft. Betrachtet man beispielsweise von KI erstellte Bilder, die vor 10 Jahren erstellt wurden und vergleicht sie dann mit denselben Vorgaben von heute, kann man dort gewaltige Unterschiede feststellen.

Viele KI-Bilder sind mittlerweile nur noch schwer von "echten" Bildern zu unterscheiden. Aber auch in der Hörspiel- und Synchronbranche hat sich bereits einiges getan. Auf YouTube (und wahrscheinlich auch auf anderen Plattformen) tauchen immer mehr KI-generierte Videos auf, auf denen unter anderem auch sämtliche OFF-Sprecher nur von einer KI gesprochen werden.

Zu Beginn merkt man so etwas kaum, aber wenn man länger zuhört fallen einem dann doch einige Passage auf, die seltsam betont werden und das nicht unbedingt zum Stil des Sprechers passt. :unsure:

Auch in der Synchronisierung von Filmen konnte man schon gewaltige Forschritte verzeichnen. Es ist beispielsweise schon gelungen, Filme mithilfe von KI anhand der Original-Sprache des Films in beliebige Sprachen zu verändern - und dies geschieht, ohne dass jemand dafür einen Text einsprechen muss. Sogar die Lippenbewegungen werden bei so einer KI-Überarbeitung exakt "nachbearbeitet". Das könnte also bedeuten, dass wir im Laufe der nächsten Jahre unsere (Kino-)Filme mit den Originalstimmen betrachten können, aber gleichzeitig auch in unserer Sprache.

Wie seht ihr das Ganze - ist damit gleich der gesamte Bereich des Sprechens bedroht? Trifft es nur Teilbereiche? Oder hat KI möglicherweise gar keine nennenswerte Zukunft? Läuft es möglicherweise darauf hinaus, dass man einen Qualitätsunterschied macht, dass es z.B. heißt: Dieses Hörbuch wurde von einem ECHTEN SPRECHER eingesprochen (es hat sozusagen BIO-Qualität 😁 )

Bin gespannt eure Meinungen zu diesem Thema zu hören!
 

Telliminator

Sample-Collector
Sprechprobe
Link
Böses Thema und ganz dünnes Eis.

Ich sag nur so viel, es geht viel mehr als wir uns im Klaren sind.

Willst Du ein mieses Beispiel?

Oder sowas hier?
 

Lauschecke

Lauschecke
Eben deswegen finde ich es wichtig, es auch zur Sprache zu bringen. Interessanterweise habe ich "Breaking Bad"-Video sogar gestern erst gesehen 😅
Würdest du sagen, dass sozusagen unsere "künsterlische Existenz" auf dem Spiel steht?
 

Telliminator

Sample-Collector
Sprechprobe
Link
Würdest du sagen, dass sozusagen unsere "künsterlische Existenz" auf dem Spiel steht?
In gewisser Weise schon, denn sind wir mal ehrlich - mit Hilfe der K.I. ist es möglich aus jeder Stimme ein Sprachmodell zu erstellen. Mit dieser synthetischen K.I. Stimme kann man alles sagen lassen, was man ihr vorgibt oder sich die K.I sogar selbst zurecht rechnet.

Wir sind bald nicht mehr weit davon entfernt zwischen echt und K.I. zu unterscheiden. Und das Beispiel "Breaking Bad", ist wirklich sehr schlecht gemachtes Deep Fake und noch nicht optimierter Eiinsatz von K.I. als Stimme. Dennoch, wenn Du Dich auf dem Kanal umsiehst, haben die noch viel mehr Unfug getrieben und das ist schon wieder sehr erschreckend, wenn man das weiter spinnt und die Qualität der Videos und K.I. Technik noch mehr zunimmt. Dann weißt du nicht mehr, ob diese Videos noch echt oder gestellt sind. Und darin liegt die Gefahr.

Eine Art Bio-Zertiflikat, "Nur mit echten Stimmen", klingt nach einer guten Marketing Idee. (y)
 

pio

Autor, Audio Engineer (BA), Sprecher und Musiker
Sprechprobe
Link
Ich habe letztens einen Kanal auf YT gefunden auf dem SciFi Geschichten von einer KI vorgelesen werden. Ich war ernsthaft beeindruckt.....

 

Delay

Mitglied
Sprechprobe
Link
Es ist letztlich eine Kostenentscheidung, noch ist es vermutlich günstiger das Synchronsprecher machen zu lassen, langfristig wird das Preisgefüge sich zugunsten der KI kippen, am Ende entscheidet der Endverbraucher was er sehen und hören will. Den meisten wird es aber vermutlich schlichtweg egal sein.
 

Telliminator

Sample-Collector
Sprechprobe
Link
@pio Ich hab den Kanal links gemacht, aber leider keinen Hinweis darauf gefunden, mit welcher K.I. das gemacht wurde. Das ist schon echt gut, vor allem der Erziähstil und die Sprachausgabe bei den gesprochen Sätzen, wenn die Figuren was sagen. Die Betonung ist kaum als K.I. erkennbar.
 

Lauschecke

Lauschecke
Ich habe letztens einen Kanal auf YT gefunden auf dem SciFi Geschichten von einer KI vorgelesen werden. Ich war ernsthaft beeindruckt.....
Ja, da gibt es tatsächlich einige. Wobei ich auch hier bei deinem Beispiel sagen muss, dass mir die Lesart nicht zusagt - eben wie ich schon Anfangs beschrieben hatte: Manchmal kommt einem die Betonung seltsam vor...und das reißt einen aus dem Hörerfluss.

Klar, die Stimme ist sehr gut und liest auch das meiste richtig, aber mir persönlich fehlt hier tatsächlich irgendwie die menschliche Komponente. Kann auch sein, dass es mir nur deswegen auffällt, weil ich allgemein darauf bei sämtlichen Hörspielen/Hörbüchern explizit achte...
 

soundjob

Tontüte & Hörspielfrisör
Sprechprobe
Link
Gegenwärtig ist KI (KI Training) eine wahre Goldgrube und etliche Firmen auf diesen Zug noch aufspringen und das Eisen schmieden, solange es noch schön heiß ist.
Über kurz oder noch kürzer, wird KI in allen künstlerisch gestalteten Bereichen eine "Wachablösung" vollziehen, aber (zunächst) vermutlich nicht gänzlich und vollständig.

Neue Technologien bieten neue Möglichkeiten und andere Berufsfelder und völlig verschwinden, wird der Faktor Mensch (zunächst) dennoch nicht... das war vor ü40 Jahren schon so, als z.B. Orchestermusiker auf die Barrikaden gingen, als es immer besser klingende Samples gab und in der Filmmusik mehr und mehr Synths&Co zu hören gab... verschwunden ist der Orchestermusiker und echte Orchestermusiken in z.B. Filmen dennoch nicht.
Die Zukunft der KI und etwaige Branchen sehe ich für die nächsten Dekaden sich dahin entwickelnd ähnlich... eigentlich, genau genommen, gibt es diese Themen der Wachablösung "MenschMaschine" ja ohnehin schon seit Auftauchen des Computers in der modernen Arbeitswelt.

Unterm Strich wird vieles nicht so heiß gegessen, wie es immer gekocht wird... aber ohne Zweifel gehört KI die Zukunft.... ob das nun so intelligent ist, lass´ ich aber mal dahingestellt.
 

pio

Autor, Audio Engineer (BA), Sprecher und Musiker
Sprechprobe
Link
@pio Ich hab den Kanal links gemacht, aber leider keinen Hinweis darauf gefunden, mit welcher K.I. das gemacht wurde. Das ist schon echt gut, vor allem der Erziähstil und die Sprachausgabe bei den gesprochen Sätzen, wenn die Figuren was sagen. Die Betonung ist kaum als K.I. erkennbar.
Ich hatte Kontakt mit dem Kollegen der den Kanal betreibt. Der lässt dass von der freien (!) Version dieser KI einsprechen: ElevenLabs: Free Text to Speech & AI Voice Generator | ElevenLabs
 

Spirit328

Everything - GO!
Teammitglied
Die KI-Stimmen werden immer besser und klingen immer "natürlicher". Es ist schon beeindrückend, was sie können und wie weit die Technologie da schon ist.
Es ist aber zeitgleich sehr beängstigend, was damit schon alles, sofern frei verfügbar, machbar ist.
Vielleicht erinnert Ihr Euch noch an Terminator I? Als Arnie als Terminator die Stimme von Sam nachahmt. Damals war der Trick mehr als durchschaubar ( _zwinker_), aber heute geht so etwas in (annähernd) Echtzeit, auf jeden Fall lippensynchron.

Woran aber bisher jede KI gescheitert ist, ist ein wirklich simples und zugleich kompliziertes Beispiel:
"Liebe Judith" - Wenn man das mit unterschiedlichsten Betonungen, Tonfällen und Pausen ausspricht, kann man damit 10-20 Bedeutungen realisieren. - eat this, AI! :D
 
Zuletzt bearbeitet:

Telliminator

Sample-Collector
Sprechprobe
Link
@pio Danke für den Link. Ich hatte mir das jetzt etwas komplizierter vorgestellt, als so eine "einfache" Text2Speech Anwendung auf einer Webseite. Es ist auf jedenfalls schon nicht schlecht und die unterschiedlichen Stimmen bieten zumindest mal eine Vorauswahl, wenngleich mir nicht alle Stimmen dort zusagen.

Das nexte Level ist ja schon gegeben, das man einem kurzem Sample einer realen Stimme, das Stimmenmodell erstellt und sämtliche Texte in der Stimme eines jeden nachahmen kann, das @Spirit328 hier in seinem Beispiel von Terminator andeutete.

Auch hierzu habe ich ein kleines Beispiel, bei dem ich einem Stimmenmodell einer prominenten Stimme einen Text in den Mund gelegt habe, den die Dame in ihrem realen Leben wohl bestimmt niemals gesagt hat.



Das Stimmenmodell ist noch etwas starksig und man hört natürlich heraus, dass es nicht echt ist.
 

WolfsOhr

Mario Wolf
Sprechprobe
Link
Ein Thema, das in der Sprecherbranche natürlich sehr heiß ist.
Der Sprecherberuf ist sicherlich in Gefahr, aber ich denke es wird langfristig (so wie jetzt ja eigentlich auch schon) beides parallel laufen. Nicht jeder will den monotonen KI-Schrott (hart ausgedrückt) verwenden und hören, denn egal wie gut die technische Umsetzung ist, und es sei mal dahingestellt, ob es wirklich Intelligenz ist oder nicht, es wird ihr IMMER die Seele und der Geist fehlen. Und das ist etwas, das wir Menschen brauchen, ob wir das gerade bewusst wissen oder nicht.
Des Weiteren glaube ich, dass sich hier natürlich bei den Sprechern die Spreu vom Weizen trennen wird, denn nur die besseren, vielleicht auch die mit dem besseren Service, werden überleben.
Und genauso ist das auch bei den Produkten/Herstellern. Wer jetzt auf ein schlechtes KI-Pferd setzt, sprich sein Marketing schlecht mit KI umsetzt, wird unter umständen von seinen Konkurrenten angehängt.
Und dann ist da noch die lange noch nicht ausgefochtene Problematik der rechtlichen Seite, der Lizensierung. Denn meines Wissens nach hat noch kein KI-Stimmen "Harausgeber" offen gelegt, wie sie ihr System angelernt haben. Hier werden eventuell irgendwann Zahlungen fällig. Das ist alles noch sehr offen und die rechtliche Seite lange nicht geklärt. Da könnte theoretisch auch was nach hinten losgehen.
Und die Sprecherseite ist natürlich auch fett am kämpfen.
Aber man wird sehen. Die KI ist auf jeden Fall nicht mehr wegzudenken, aber es wird vermutlich beides parallel bestehen. So wie in anderen Bereichen ja auch, wie bereits gesagt wurde.
 

knilch

Hä? Was heißt das?
Was ich bei meinen Projekten immer sehr geschätzt habe (auch wenn das jetzt noch nicht so viele waren), den menschlichen unberechenbaren Einfluss von Erfahrung oder Zufall. Immer wieder habe ich aufgenommene Textstellen, die ich mir anders vorgestellt habe und dann kommt ein Sprecher daher und meint 'schau mal' und ich denke, 'ja hallo, das ist ja viel besser' :D allein aus diesem Grund würde ich so schnell keine Stimmgeneratoren einsetzen. Aber ich muss davon halt auch nicht Leben können und das macht es für mich einfach, das so sagen zu können.
 
Oben