[blog] Freitag ist Ki-Tag :)

  • Kaum hatte mich ideogram so richtig gepackt, kommt DALL-E 3 raus (noch nicht für jeden).

    Und macht wie immer alles noch besser.

    Das ist erstmal einfach gesagt: korrekt.

    Und was ideogram so spaßig macht, ist die Texterstellung in Bildern.

    Aber auch da ist E 3 vorn angekommen:

    Das Bild erinnert mich sehr(!) stark an die Poster von der NASA.

    Aber das reicht noch nicht, um eine V3 rauszuhauen.

    Das ganze ist jetzt in ChatGPT vorhanden. Also die aktuell vermutlich fähigste Textbasierte KI arbeitet Bit-in-Bit mit DALL-E zusammen.

    Ist ja auch die gleiche Firma.

    Sidenote: das wird in MS-Paint ebenfalls gerade eingepflegt. Yep. Paint kann bald Ki, Ebenen kann es ja jetzt schon.

    Was DALL-E immer etwas "schlechter" gemacht hat, war einfach dieser fehlende WOW-Alter! Effekt.

    midjourney hatte einfach immer etwas mehr coolness.

    Das ging bestenfalls mit stable-diffusion in der Art.

    Auch der Drops ist gelutscht:

    Now it has superpower!

    Externer Inhalt www.youtube.com
    Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

  • Kann irgendeins von den Teilen Konsistenz über mehrere Bilder hinweg ? Also Stil, Figuren oder Szenerien, deren Charakteristika konsistent sind ?

    "Show me the same scenery from a 40 degree angle to the left" z.b. so als Anfang ?

    Dachte halt gerade daran, wie weit wir davon weg ist, das man auch ohne graphische Fähigkeiten nur durch die textuellen Beschreibungen erst mal eine Welt modelliert (stil, objekte, personen, raeume), und dann eben eine story ueber mehrere Bilder raushauen kann. Also comics/cartoons, adventure-spiele etc. auf diese Art zu kreieren.

  • Nextcloud hat inzwischen offenbar auch die Möglichkeit KI zu integrieren:

    AI in Nextcloud: what, why and how - Nextcloud
    Over the last year, AI has become a popular topic. Some is hype, some is substance. Some is good, some is bad. We want to give you the good, not the bad, and…
    nextcloud.com

    Das interessante daran? Es werden auch lokale Lösungen angeboten, bei denen sämtliche Daten ohne die Zuhilfenahme externer Dienste verarbeitet werden.

    Hat das hier schon jemand ausprobiert?

  • Und schon wieder schlägt eine Ki einen Algo.

    In diesem Fall in der verlustfreien Komprimierung von Bildern und Musik.

    Wohl gemerkt: wir reden hier von lossless. Also so Dinge wie

    -> statt 10100 10100 10100 schreibt man beispielsweise 3 x 10100 <-

    Wie viel besser kann so etwas werden?

    Bei lossless muss nach dem entpacken wieder alles bit-für-bit übereinstimmen.

    Eine Ki arbeitet ja auch mit Mustererkennung.

    Und wenn etwas nach Muster aussieht, dann ja wohl das Beispiel oben.

    Es war naheliegend, eine Ki speziell darauf zu trainieren.

    Aber: nicht diese war am Ende die beste, sondern ein allgemeines Modell.

    Das verwundert mich dann doch schon etwas.

    Aus dieser Quelle herausgefiltert:

    -> http://arxiv.org/pdf/2309.10668.pdf

    Code
    Das KI-Modell Chinchilla 70B, das hauptsächlich für den Umgang mit Text trainiert wurde, kann Bilder und Audiodateien erstaunlich gut komprimieren.
    So komprimierte es Bilder auf 43,4 % ihrer ursprünglichen Größe, was sogar besser ist als der bewährte PNG-Algorithmus (58,5 %).
    Audiodateien komprimierte es sogar auf nur 16,4 % ihrer ursprünglichen Größe, was die übliche FLAC-Komprimierung (30,3 %) deutlich übertrifft.
    Diese Ergebnisse sind besonders bemerkenswert, da Chinchilla 70B nicht speziell für die Bild- oder Audiokomprimierung entwickelt wurde. 

    Aber wird das jetzt DER neue Weg um Dinge zu komprimieren?

    Ich denke eher nicht.

    PNG ist ein sehr kleiner Algo, der auch nur sehr wenig verbraucht.

    Also in jeder Hinsicht "schmal" ist. Wenige KB.

    Ein sehr spannender Artikel dazu:

    -> https://medium.com/@duhroach/how-png-works-f1174e3cc7b7

    Die Ki dagegen ist ein Monster.

    Das Chinchilla 70B Modell benötigt mehrere parallel geschaltete Hochleistungs-GPUs und hunderte GB an GPU-RAM.

  • So richtig erschliesst sich mir nicht, wie die ihr neuronales Netz so trainieren, das es lossless ist. Selbst wenn man einfach nur Ergebnisse von gzip nimmt zum trainieren wuerde ein LLM da ja immer "haluzinieren". Oder andersherum: Wenn die lossless compression koennen, warum koennen sie dann keine nicht-haluzinierenden LLM ?

    Ansonsten waeren ja solche fetten AI Maschinen zur Komprimierung natuerlich auch nette Verschluesselungsmaschinen. Da musste wirklich die ganze Maschine klauen und haettest wohl auch wenig chance durch neutrainieren exakt dieselbe verschluesselungs/entschluessellungsmaschine hinzubekommen.

    Was ist dann die kleinste und schnellste AI Komprimierung, die Quantum schlaegt ?

    Ansonsten bin ich natuerlich auch eher fuer klein und schnell.Alles was ich so an fetten backups habe, partitionen usw. und deswegen schnell mal dekomprimieren muss - da nehm ich nur noch lz4 statt frueher gzip. Für Medien ist lossless ja IMHO nicht relevant. Ok. frueher haette ich gesagt das man lossless fuer Text braucht, aber nachdem dieser Planet sich ja mit haluzinierenden LLMs abzufinden scheint stimmt das ja auch nicht mehr. "Liebe Kinder der 7ten Klasse, heute lesen wir den klassischen deutschen Text 'Die Glocke des Faust' von ChatGPT, weil der Lehrplan komprimiert werden musste"

  • Wirklich überraschend ist es nicht, aber ich find es trotzdem spooky, was da mittlerweile alles passiert:

    Wie Deepfakes in China im Livestream Produkte anpreisen
    Mit nur ein paar Minuten Beispielvideo und 1000 Euro können Marken in China ihre Produkte 24 Stunden am Tag an die User bringen.
    www.heise.de

    Da fragt man sich schon, ob es demnächst überhaupt noch Nachrichtensprecher oder Moderatoren gibt, wenn das alles auch eine KI-generierter Avatar übernehmen kann.

  • Es gibt auch auf den Social Media Kanälen ganze Existenzen mit etlichen Followern, die komplett generiert sind.

    Aber wie es Tom Hanks gerade sagte: "Ob es den Zuschauer überhaupt interessieren wird, ob Mensch oder nicht, bleibt die Frage" (frei zitiert)

    Virtuelle Influenzer.

    Kyra ist da aktuell ganz groß.

    Über 240.000 Follower. Und folgt auch selbst anderen.

    Dabei ist das nicht mal richtig gut. Doch noch recht "uncanny valley"

    Da ist der obere Beitrag schon sehr viel besser.

    Sehr witzig finde ich da auch "imma aus Tokio".

    Als einfacher Europäer fällt es mir da schon schwerer, das immer als "nicht Mensch" zu erkennen.

    Und sie schreibt, dass sie sich gerade neue Topfpflanzen für ihre Wohnung geholt hat.

    Setzt sich für den Umweltschutz ein.

    Hat fast 400k Follower. Generiert Werbeeinnahmen.

    Habt ihr das Video vom neunen "Tesla Roboter" gesehen?

    Externer Inhalt www.youtube.com
    Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

    Die fangen gerade an richtig zu lernen mit Ki.

    Und treffen auch schon die ersten eigenen Korrekturentscheidungen.

    Oder der hier. Wirkt etwas zittrig, aber hat sich das alles selbst beigebracht:

    Externer Inhalt www.youtube.com
    Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

  • Ich kann noch nicht so recht glauben, das das Begrabbeln und Benuzten eines beliebigen Produktes vollsynthetisch als Video erstellt werden kann. So hört sich das aber in dem Bericht an. Von daheber bin ich da skeptisch. Klar, irgendein Quasimodo bespasst das Produkt und mit DeppFake wird Video und Stimme druebergespielt. Oder es wird das Produkt gar nicht begrabbelt, sondern steht bloss dumm rum und langweilt sich. Oder das begrabbeln sieht so bekloppt aus wie bei all den billigen Collagebildern in Katalogen, wie Pearl oder so. Beliebige Groessenverhaeltnisse von Haenden und Produkten.

    Beispielvideo waere mal interessant. Aber ok. wenn ich mal solche Shoppingvideos gesehen habe, dann waren das immer irgendwelche Kochutensilien und da wurde im studio "gekocht". Und dann war da eine unglaublich schlechte deutsche Syncro auf einem unglaublich schlechten englischen Script drauf, und die Darsteller hätten echt Deepfakes gebraucht.

    Ansonsten gehen mir ja schon die synthetichen Studioeinrichtungen bei den Nachrichtensendungen voll auf den Wecker.

    Aka: kann alles nur besser werden, aber ich werds eh nicht anschauen wollen, also: Es faellt ein Sack Reis in China um. Tragisch.

  • Zum einen hat man schon sehr bald nichts mehr, woran man die Realität noch abklopfen kann, wenn es über Medien gleich weder Art reinkommt.

    Und die beiden Videos (Optimus und der Hund) zeigen, wie stark Maschinen-Lernen in der Robotik jetzt schon ist.

    Da fragt man sich doch nicht mehr, ob eine Maschine den eigenen Job übernehmen könnte.

    Die Maschine steht eine Zeit lang neben dir, lernt und kann es dann besser.

    Und zwar alles.

    Klar kommen dann wieder Argumente zu Tage in Richtung "kann doch kein Handwerker bezahlen so einen Robi".

    Aber das ist auch die falsche Annahme.

    Wahrscheinlicher ist doch eine Firma, die genau das anbietet. Also nicht eine News wie "Fliesenleger Karl hat jetzt einen digitalen Kollegen".

    Sondern "Flies-O-Mat" kommt auch zu ihnen.

    Das klingt alles noch nach weiter Zukunft.

    Aber die Geschwindigkeit wird nicht langsamer werden.

    Schaut euch nur dieses Thema von Januar bis heute an.

  • Da bin ich absolut bei dir. Das Tempo ist gerade wirklich atemberaubend und die Frage ist eher wann, und nicht ob KI in vielen Bereichen Einzug halten wird.

    Aktuell sind die meisten wohl noch in der Findungsphase, womit man da Geld verdienen kann, gerade weil die Kosten schätzungsweise noch recht hoch sind.

    Aber wenn das ganze mal halbwegs rentabel ist, dann wird es an allen Ecken und Enden kommen.

  • Wenn die Arbeit der Robbis/Avatare das Geld verdient, wer ist denn dann deren Zuhaelter ?

    Roboter die ich mir privat kaufen kann sind doch nicht das Problem. Das Problem ist doch, wenn die die Arbeit von Menschen ersetzen, und wir dann auf sagen wir mal 10 Millionen Arbeitslose zulaufen.

    Und die Roboter/Avatare zahlen noch nicht mal Sozialabgaben oder Steuern, weil die Firmen denen sie gehoeren globale Player vom Type eines Amazon oder Starbucks sind, deren Geschaeft so organisiert ist, das die in Deutschland (nahezu) keine Gewinne/Steuern zahlen.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!