ifun.de — Apple News seit 2001. 39 629 Artikel

Neues Text-zu-Video-Modell

Sora: ChatGPT kann jetzt auch Videos – und zwar photorealistisch

Artikel auf Mastodon teilen.
28 Kommentare 28

Fast kein Tag, an dem die treibenden KI-Unternehmen nicht einen signifikanten Durchbruch, ein neues Produkt oder eine Erweiterung der bisherigen Kapazitäten vermelden würden. Das nach Googles Ankündigung von Gemini 1.5 jüngste Beispiel: Die für den Chatbot ChatGPT verantwortlichen KI-Experten von OpenAI haben mit Sora nun ein erstes KI-Modell vorgestellt, das realistische Videosequenzen aus einfachen Texteingaben erstellen kann.

Hund Sora Openai

Noch steht Sora nicht zur allgemeinen Nutzung bereit, die auf der Projektseite veröffentlichten Beispielvideos laden jedoch schon zum Staunen ein. Die hier veröffentlichten Videosequenzen, die etwa eine Frau beim Abendspaziergang durch Tokio, einen Jeep während einer Offroad-Geländetour oder den Spaziergang durch eine Kunstgalerie zeigen, wurden alle lediglich durch Eingabe einfacher Textbeschreibungen generiert.

Die Texteingabe für den Abendspaziergang besteht dabei nur aus sechs Sätzen, die ihrerseits einmal den Hintergrund der Neon beleuchteten Großstadt beschreiben, kurz auf das Outfit der Frau mit schwarzen Schuhen, Lederjacke und rotem Kleid eingehen und anschließend noch den selbstbewussten Gang, die spiegelnde Straße und die im Hintergrund spazierenden Fußgänger skizzieren.

Der Prompt im Volltext:

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

In einem ersten Schritt wird Sora nun ausgewählten Künstlern, Designern und Filmemachern zugänglich gemacht, die mit dem neuen Werkzeug experimentieren sollen. Gleichzeitig prüfen die Verantwortlichen von OpenAI das Modell auf Risiken und wollen eine missbräuchliche Anwendung ausschließen.

Wir empfehlen euch unbedingt einen Abstecher auf diese Demo-Seite und können technisch interessierten Lesern zudem dieses Hintergrundpapier ans Herz legen, das auf Aufbaustruktur und Erkenntnisse beim Bau des Videogenerators eingeht und zahlreiche Beispiele zeigt, die so gut wie nicht mehr von echten Kameraaufnahmen zu unterscheiden sind.


16. Feb. 2024 um 09:06 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    28 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Ist noch nicht perfekt. Ihre linke Hand sieht komisch aus und wenn man genau hinschaut, schwebt sie über dem Boden.

    #meckern auf hohem Niveau.

    Antworten moderated
  • Beeindruckend!
    Man hätte noch eingeben können, welche Kamera sich in der Sonnenbrille spiegelt :)

  • Achtet mal auf die Menschen im Hintergrund des ersten Videos. Beim Gehen vertauschen sich plötzlich die Beine, dafür muss man aber ganz genau hingucken. Es scheint als hätte die KI das Konzept der „zwei Beine“ des Menschen nur bis zu einem gewissen Grad verstanden…

    Antworten moderated
  • Die Grafikleistung die gebraucht wird für dieses rendering…

  • Besser photorealistisch als ich es -jemals- per GPT Pro und DallE geschafft habe.

  • Alles ja gut und schön aber entweder ich bin mittlerweile zu alt oder nicht die richtige Zielgruppe. Braucht das ein Normalbürger täglich ? ChatGPT usw. Habe mir das mal angeschaut und für toll befunden und dann war das Thema wieder für mich erledigt. Nichts was ich täglich irgendwie benutzen müsste.

    Antworten moderated
    • Du bist halt nunmal nicht die gesamte Bevölkerung und zweitens sind auch Dinge wichtig die man nicht jeden Tag benutzt. Sei es auch nur einmal im Monat. Manch anderer benutzt das vielleicht jeden Tag.

    • Nicht von sich auf andere schließen. Als Entwickler habe ich durchaus regelmäßig was mit ChatGPT zutun, kann sehr Hilfreich sein, programmieren muss man aber immer noch können. Andere wollen sich aber auch einfach nur eine Email, oder ein Formular generieren lassen. Es gibt sehr viele use cases.

  • Damit werden Nachrichten immer unglaubwürdiger, z.B. Wahlkampf, Krieg- und Kriegserklärung, sprich Meinungsbeeinflussung im Fernsehen und wird dann bis zu YouTube,Ticktok und Co gehen. Am Anfang wird es nur von Regierungen und Geheimdiensten ausgenutzt und später auch von so manchen privaten Mediengestalter um seine Clickzahlen zu steigern.
    Und wie will man dann unterscheiden „Was ist Wahrheit und was ist Lüge“

    • Exakt….man hat keine Möglichkeit mehr zu unterscheiden….wahr oder unwahr!
      ERSCHRECKEND!

    • Das größte Problem sehe ich darin, dass echte (!) Videos, die Straftaten oder Skandale zeigen, künftig immer und eher unwiderlegbar in Frage gestellt werden. Vor Gericht dürfte sowas kaum noch als Beweis nutzbar sein.

      Wenn also Donald Trump mal wieder bei etwas erwischt wird, was ihn den Kopf kosten könnte, kann er einfach behaupten, das Video wäre ein Kunstprodukt. Und seine Anhänger/Jünger glauben ihm das noch mehr, als sie es heute schon viel zu oft tun.

  • Hammer, auch wenn das laufen der Dame die immersion ein wenig zerstört.

    Antworten moderated
  • John Applespeed

    Jetzt wird’s wirklich ernst und echt beängstigend.
    Besonders auch: wenn man sieht mit welcher Geschwindigkeit sich das gerade entwickelt, man kommt ja gar nicht hinterher

    • Es ist ganz „einfach“!
      Du triffst bewusst die Entscheidung wie viele Informationen du aufnehmen möchtest.
      Du kannst zum Beispiel damit anfangen deinen Nachrichteninput auf bestimmte, von dir ausgewählte Quellen zu beschränken und dir auch mehr Zeit in einem Umfeld gönnen in dem du nicht pausenlos mit Informationen überflutet wirst.
      Auf jeden Fall sollten wir alle unseren Datenkonsum überprüfen und vor allem strenger limitieren.

      • @svc Exakt! Diese ganze Debatte über Fake News und Hassrede bezieht sich nämlich fast ausschließlich auf soziale Netzwerke. Würden die Leute einfach die Finger von diesen lassen und nicht pausenlos durch endlose Timelines scrollen, wären die Gefahren nämlich um einiges geringer. Jedenfalls findet man absichtliche Falschnachrichten und Hassrede sehr viel seltener in klassischen Nachrichtenquellen, mal abgesehen von Fox News vielleicht.

  • Erschreckend und genial zugleich was da jetzt bereits geht. Und das ist jetzt die schlechteste Version von allen die da noch kommen werden.

    Antworten moderated
  • Man gibt irgendwann einfach ein Drehbuch als Prompt ein und – voilà! – fertig ist ein Film. Oder ein etwas anderer …
    So kann man sich seine Wunschfilme selber basteln, indem man zufällig erzeugte Überraschungen einbauen lässt.

    Antworten moderated
  • Weiß was ich falsch mache aber alle bisherigen Grafik KIs haben nichtmals ansatzweise das geliefert was in den Vorschaubildern zur Schau gestellt wird. Von daher bin ichmehr als skeptisch wie dass dann mit Videos funktionieren soll. Die Vorschau Videos sind ja nett gemacht, aber wenn in der Realität dann nichts so funktioniert ist das doch Käse

  • Was ist schon real? Gibt es die Realität wirklich? Es gibt Wissenschaftler, die sich mit dieser Frage beschäftigen

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 39629 Artikel in den vergangenen 8492 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2025 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven