ifun.de — Apple News seit 2001. 39 293 Artikel

Neues LLM zur Videoerstellung

Google VideoPoet: KI-generierte Videos beeindrucken

Artikel auf Mastodon teilen.
6 Kommentare 6

Nach den künstlich-intelligenten Bildgeneratoren, die vor allem durch die Freigabe des gemeinfreien Modells „Stable Diffusion“ vorangetrieben wurden, und dem KI-Sprachmodell ChatGPT, das in der Lage ist, erstaunlich menschähnliche Texte zu erstellen, konzentrieren sich viele Entwicklungen im Bereich der künstlichen Intelligenz jetzt auf die Ausgabe von bewegtem Bildmaterial.

Video Poet Google

Die bislang am Markt aktiven Videogeneratoren sind zwar alle in der Lage, mit ihren hochqualitativen Ergebnissen auf nahezu beliebige Nutzereingaben zu verblüffen, viele haben jedoch Probleme damit, flüssige Bewegungsabläufe zu erzeugen und fallen durch wenig überzeugende Animationen und stotternde Protagonisten auf.

Die KI-Bildgeneratoren wurden in ihren Anfangstagen durch Finger und Hände aus dem Tritt gebracht und zeichneten häufig zu viele Gliedmaßen. Die aktuellen Videogeneratoren produzieren digitale Artefakte, sobald umfangreiche Bewegungsabläufe visualisiert werden sollen.

Google VideoPoet

Zumindest war dies bislang der Fall. Googles KI-Forschungsabteilung hat mit Google VideoPoet jetzt ein neues Modell für die so genannte „zero-shot video generation“ vorgelegt, das verblüffend gute Ergebnisse auch dann abliefert, wenn Bewegungen ausgegeben werden sollen.

Videopoet

VideoPoet ist ein Large Language Model (LLM), das Videos auf Grundlage von Texteingaben erstellen, Bilder in Videos konvertieren und Videoeffekte anwenden kann. Sogar das In- und Out-Painting von bereits vorhandenen Videoinhalten ist möglich.

Wir empfehlen euch, unbedingt einen Abstecher auf die Demo-Webseite von VideoPoet zu unternehmen. Hier wurden zahlreiche Ergebnisse mit kurzen Beispielvideos abgelegt, um die unterschiedlichen Kapazitäten des Modells zu demonstrieren. Besonders sehenswert: Auch die Videobearbeitung ist zukünftig offenbar problemlos mit Hilfe von Texteingaben möglich.

20. Dez 2023 um 15:01 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    6 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Electrocker2000

    Sehr beeindruckend. Weiß man, wann Otto Normalverbraucher das auch benutzen darf? Auf der Webseite sehe ich leider nichts.

  • Hm. Irgendwie beeindrucken mich bisher keine AI Demos, vor allem wenn es um Bilder oder Videos geht. Von einigen Ergebnissen von ChatPGP abgesehen.

  • Fazinierend aber auch gruselig, was da alles auf uns zukommt.

    • Das sehe ich leider ebenso. Die Beispiel-Videos sind alle schön bunt und kreativ, aber in den Händen böswilliger Leute können zukünftig Massen manipuliert werden, z. B. mit – mal plakativ formuliert – Videos, die den US-Präsidenten beim Verbrennen des Korans zeigen.

    • Sehe ich auch so, finde es jetzt aber schon grauenhaft wie wenig viele Nachrichten nicht mehr hinterfragt werden und falsche Fakten verbreitet werden.Man muss heutzutage sein Hirn einschalten und darf nicht gutgläubig alles glauben, was man in seine Bubble gestellt bekommt.

    Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 39293 Artikel in den vergangenen 8430 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2024 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven