Und damit hätten wir auch den nächsten Sensor für die Realität überschrieben.
Sprachsynthese war schon immer eher Googles Ecke, aber die Macher hinter Dall-E haben,
wenn auch etwas früh, nun auch ihre Sprachsynthese vorgestellt.
Laut Paper werden nur drei Sekunden der eigenen Stimme benötigt um synthetisiert zu werden.
Noch nicht 100% perfekt, aber in einer fremden Sprache schon mehr als gut genug.
Wie schon in den anderen Ki-Themen geschrieben: wir schaffen uns gerade neue gefühlte Realitäten.
Die Kombi aus den aktuellen Ki's ist so überwältigend, dass aus meiner Sicht das Gehirn nicht mehr mitkommt.
Ich habe ChatGPT eine Trauerrede verfassen und Midjourney den Traum meines Sohns erfüllen lassen. (siehe Anhang)
Im Netz gab es für ein paar Stunden einen Bericht über Silvester in Berlin und Paris, der komplett, inkl Bilder, Ki-generiert war. (wurde rausgenommen).
Also nicht zusammengestellt, sondern 100% generiert.
-> https://t3n.de/news/vall-e-im…timmen-1526152/
Ich sehe da auch jetzt nicht das Ende der Kreativität oder etwas anderes negatives.
Im Gegenteil. Es bringt sehr viel mehr Qualität als ich mir je hätte einfallen lassen können.
Alleine schon der Output auf Discord ist so vielfältig, da er von der ganzen Welt genutzt wird.
Mich pusht es.
Sicherlich bleiben Zweifel. Böse Menschen und so.
Aber ich, jetzt, heute, in diesem Moment: eine Ki ist ein Kind, das spielen will. Und ich spiele gern