<aside> ☝ Ähnlich wie Bildgeneratoren à la Midjourney gibt es inzwischen auch Videogeneratoren, die es erlauben, aus einem Prompt oder auch einem Startbild einen kurzen Videoclip zu erzeugen. Die zugrundeliegenden Modelle sind sehr umfangreich und aufwändig zu trainieren. Die Qualität der Ergebnisse schwankt teilweise massiv und ist bisher nur bedingt professionell nutzbar, was sich aber schnell ändern kann.
</aside>
Der Video-Generator Dream Machine ist im Juni 2024 gestartet und hat fast augenblicklich einen Hype ausgelöst. Denn das KI-Modell hinter dem Dienst erlaubt es, erstaunlich fotorealistische und besonders cineastische und stimmige Kamerafahrten und Charakterinszenierungen zu erzeugen - wenn der Prompt stimmt. Die besten Ergebnisse lassen sich erzielen, wenn bereits mit Midjourney, Stable Diffusion oder DALL-E 3 vorgefertigte Bilder als Ausgangsmaterial hinzugefügt werden.
watermarked_video09fc1ed23b59b4977896cfe55e245c295.mp4
Im Februar 2023 stellte OpenAI Sora vor, ein neues KI-Modell, das erstaunlich fotorealistische Videos von bis zu einer Minute Länge erstellen kann – basierend auf einem Prompt, einem Bild oder einem Video. Die Reaktionen auf Sora waren bisher überwältigend, auch wenn die Kreationen der KI nicht ganz fehlerfrei sind. Nach langem Warten wurde der Dienst Anfang Dezember freigeschaltet - allerdings nicht für Nutzer aus der EU, Großbritannien und einer Liste weiterer Länder. ChatGPT-Plus- und ChatGPT-Pro-Abonnenten können bis zu 50 bzw. 500 Videos erstellen.
https://twitter.com/sama/status/1758219575882301608
Ein kleines Team arbeitet bereits mit OpenSora an einer Open-Source-Implementierung der Konzepte und Ideen hinter dem OpenAI-Videogenerator.
Das Start-up SkyReels hat mit SkyReels V1 ein leistungsfähiges Open-Source-Videomodell veröffentlicht, mit dem sehr natürlich wirkende Videos erzeugt werden können. Die Auflösung der Videos ist mit 544 x 960 Pixeln zwar gering, dafür ist das Modell auf Heimcomputern mit Grafikkarten wie der RTX 4090 nutzbar.
https://www.youtube.com/watch?v=U2SXDzQGnbQ
Das frei nutzbare KI-Video-Modell Hunyuan Video wurde vom chinesischen Technologieriesen Tencent trainiert und kann über die Plattform Github heruntergeladen werden. Es ist auch über die eigene Plattform von Tencent sowie über Rechendienste wie Replicate und Fal verfügbar. Hunyuan Video ist das bisher größte und qualitativ stärkste freie KI-Video-Modell und kann in Bezug auf die Konsistenz von Charakteren und Szenen mit kommerziellen Closed-Source-Modellen mithalten. Community-Tools ermöglichen darüber hinaus zahlreiche weitere Nutzungs- und Anpassungsmöglichkeiten. Beispielsweise können mit GoWithTheFlow Bewegungen aus anderen Videos in ein generiertes Video übertragen werden.
zbJrRVXLpmAAkXQ7HbmrZ_video-1733803869.mp4