Anlässlich seines 20. Jubiläums als Synchronsprecher veröffentlichte Yuki Kaji nicht nur einen eigenen One-Shot-Manga mit »Attack on Titan«-Autor Hajime Isayama, sondern auch eine Sprachsynthesesoftware, die auf künstlicher Intelligenz basiert.
Eigene KI-Software
Auch wenn es noch ein weiter Weg ist bis zum Legendenstatus, wie ihn beispielsweise Masako Nozawa (Son Goku aus »Dragon Ball«) und Mayumi Tanaka (Ruffy aus »One Piece«) innehaben, kann Kaji mit seinen mittlerweile 20 Arbeitsjahren in der recht kurzlebigen Anime-Industrie durchaus als kleines Urgestein bezeichnet werden.
Kein Wunder, dass das gebührend gefeiert werden muss, doch ironischerweise setzt Kaji hierfür auf die in der Branche sonst so verhasste künstliche Intelligenz.
Zusammen mit dem Unternehmen Techno-Speech stellte der Synchronsprecher von Eren Jaeger aus »Attack on Titan« nämlich die neue Sprachsynthesesoftware »Soyogi Soyogi« vor, welche er mit seiner eigenen Stimme angelernt hat.
Mit ihr können die Nutzer Kajis Stimme reproduzieren oder sogar Gesang nachahmen, wovon ihr euch weiter unten in diesem Artikel eindrucksvoll selbst überzeugen könnt. Denn dort findet ihr ein KI-Cover des ikonischen Ending-Songs »Akuma No Ko«.
Antwort auf rechtliche Grauzone
Die Software wurde ursprünglich bereits im September 2023 angekündigt und sollte über Crowdfunding mit 10 Millionen Yen (etwa 63.000 Euro) finanziert werden. Die öffentliche Resonanz übertraf jedoch alle Erwartungen, sodass am Ende mit 34,1 Millionen Yen (etwa 216.000 Euro) mehr als das Dreifache eingenommen wurde.
Doch wie kommt es, dass sich ein KI-Gegner wie Kaji, der erst vor Kurzem der Initiative »Keine unautorisierte Generierung von KI« (»NOMORE無断生成AI«) beigetreten ist, plötzlich selbst der künstlichen Intelligenz hingibt?
Laut ihm sei die Idee zur Entwicklung dieser Software aus seiner anhaltenden Sorge darüber, dass generative KI eine rechtliche Grauzone rund um Stimmrechte schaffen würde, entstanden. Ein offizielles Modell wie seines würde den Synchronsprechern eine legitime Möglichkeit bieten, ihr Talent zu nutzen, ihr geistiges Eigentum zu schützen und dennoch die ethische Nutzung neuer Technologien zu fördern.
Neben dem bereits erwähnten KI-Song-Cover findet ihr nachfolgend noch zwei weitere Videos. Was haltet ihr von dieser Begründung und der Software an sich? Lasst uns eure Meinung gerne in den Kommentaren wissen!
- Künstliche Intelligenz lässt Seiyuus um ihre Jobs bangen
- Japan passt Urheberrecht für künstliche Intelligenzen an
- Crunchyroll testet Einsatz von künstlicher Intelligenz
KI-Cover von »Akuma no Ko«:
Dieses externe Video stammt von YouTube.
Video #2:
Dieses externe Video stammt von YouTube.
Video #3:
Dieses externe Video stammt von YouTube.
Via Gamebiz
©Hajime Isayama, KODANSHA/“ATTACK ON TITAN” Production Committee.
Interessante Differenzierung. Wenn eine andere KI seine Stimme benutzt, ist es böse. Wenn es aber seine KI macht, ist es gut weil seine KI ethisch/moralisch vertretbarer ist … Das ist doch ein Witz, oder? Sein Programm bzw. das Programm woran er beteiligt ist, ist doch auch nichts anderes.
Ich könnte jetzt was zu «Doch wie kommt es, dass sich ein KI-Gegner wie Kaji […] plötzlich selbst der künstlichen Intelligenz hingibt?« schreiben, aber … mangels Hinweise verkneife ich mir das mal; das wären nur haltlose Unterstellungen.
Naja. Wenn er wirklich nur seine eigene Stimme nutzt und die Ki sozusagen nur »Worte die er als Wörterbuch einspricht moduliert«…
Ist anders als die KIs die mit »was man halt so online findet« in »Grauzone« trainiert werden und dann verwendet werden um zB Synchronsprech obsolet zu machen weil zB nur noch »Originalsprache« eingesprochen wird, der Rest dann »Übersetzt« oder gleich nur noch TTS KI…
Außerdem ist es seine Stimme. Selbst wenn es mit »anderen angelernt wäre« so lange das Ding nur seine Stimme macht, die ihm gehört, ist das maximal so wie ein Reicher Sack der nicht mehr arbeitet sondern als Privatier von den Gewinnen lebt: Hab genug »Kapital« (sein Kapital ist Bekanntheit und Stimme) Ich arbeite jetzt nix mehr, sondern lass die Software arbeiten..
Ich sehe eher andere Gefahren. Wenn das »Schule macht« dazu noch eine interaktive KI rein.. Was da an parasozialen Beziehungen passieren wird in der aktuellen »Datingwelt«… Das will ich mir gar nicht vorstellen und muss man eigentlich nicht gibt ja schon genug Filme dazu…
Er nutzt halt seine Möglichkeiten bevor, Konzerne die Angestellten und Kunden ausbeuten wies nur geht oft in Grauzonen oder ganz illegal, dann eh KI nutzten um möglichst niemandem mehr bezahlen zu müssen, weil dann ja sicher jeder noch genug Geld für Konsum hat…..
Man hört ihn schon recht gut raus wenn man sich einen Anime anschaut wo er als Sprecher dabei ist, nicht nur als Eren ist er sehr bekannt, auch als Meliodas, Shoto Todoroki und Issei.
Ist wie das deutsche Synchronstudio TNT (haben zahlreiche Anime synchronisiert), die jetzt auch auf den KI-Zug aufspringen wollen. So nach dem Motto: »Bevor andere uns abschaffen, machen wir es doch gleich selbst« xD
Die Frage ist jetzt auch, ob solche Cover unter Urheberrechtsverletzung fallen, denn man hat ja nur eine andere Stimme über den Originalgesang gelegt und nichts neu eingesungen 🤔
Aber man hat das Material ja benutzt. Falls es dazu eine Zustimmtung gab, sollte das ja kein Problem sein. Wenn nicht … theoretisch wohl ja. Aber in dem Fall wird man wohl nichts unternehmen. Die Unternehmen freuen sich ja, wenn der KI-Kram gepusht wird – und hier müssen sie es ja nichtmal selbst machen. Spart auch noch Geld, hahaha!
Alles eine Frage der »Rechte« (wichtig Rechte hat nix mit Gerechtigkeit zu tun)
War ja ein Grund warum in Hollywood so lange gestreikt wurde. Sie Studios wollten in eigentlich jeden Vertrag hineinschreiben: Dein Bild und dein Stimme gehört nachher uns wir können damit machen, was wir wollen und wenn wir dich im nächsten Film nur als digitalen Avatar wollen, dann hast du das zu fressen sonst kriegst halt auch für diesen Film keine »letzte Gage« mehr..
Überspitzt ja aber das Ziel ist das (einfach Marx über Produktionsmittel lesen und etwas in unsere Zeit transferieren die Gedanken).
Und was möglich ist sieht man schon einige Zeit. Schon vor mehr als 3 Jahren wurde bei einem spansischen wars glaub ich Horrorthriller die Synchro mit einer KI Software erstellt sogar die Mundbewegungen angepasst und he.. Ich bin in keiner der Sprachen außer englisch »fähig« große Emotionen raus zu hören, aber hörte sich für mich nicht wirklich »künstlich« an.
Die Hauptgründe warum das alles noch nicht »in Masse« eingesetzt wird ist das Copyright Problem denn: Entweder würde man da bei Ki sehr sehr streng sein dann wäre all das »Training« kaum möglich oder nur bei neuen Filmen etc wos eben im Vertrag der Sprecher steht… Oder man hält es wie bisher… Dann ist ab einer gewissen Menge KI im »Werk« das »Werk« nicht mehr »international Copyright fähig…
Da beißt das von den Konzernen für alles mögliche gern genutzte Copyright sich halt in den Schwanz.. Komplett Gesetzte immer nur zum eigenen Vorteil auslegen funktioniert hat nicht.
Finde ich ok. Es ist seine Entscheidung