Sora, új AI modell a szövegből videók készítésére

2024. február 16. by Bíró Gábor

Az OpenAI új fejlesztése, a Sora, egy AI modell, ami lehetővé teszi a felhasználók számára, hogy szöveges utasítások alapján videókat hozzanak létre.

Az OpenAI bemutatta a Sorát, egy új generatív AI modellt, amely képes szöveges utasítások alapján videókat létrehozni. A Sora egy diffúziós modell, amely transformer architektúrát használ, hasonlóan a GPT modellekhez, realisztikus és kreatív jelenetek generálására, beleértve a több karakteres összetett forgatókönyveket és specifikus mozgástípusokat. A modell képes álló képek alapján animálni, meglévő videókat kiterjeszteni, hiányzó képkockákat pótolni, legfeljebb egyperces videókat előállítani különböző stílusokban, mint a fotorealisztikus, animált vagy fekete-fehér.

Ennek ellenére a Sorának vannak korlátai, mint például a komplex fizikai jelenségek szimulálásának nehézségei, az ok-okozati összefüggések megértésének hiánya és a térbeli részletek pontos megtartásának kihívásai. Például előfordulhat, hogy nem mutatja meg a harapásnyomot egy süteményen valaki harapása után, vagy összekeverheti a bal és jobb oldalt egy jelenetben.

Az OpenAI biztonsági elővigyázatosságot gyakorol a Sora széles körű elérhetővé tétele előtt. Dolgoznak a modell lehetséges káros hatásainak tesztelésén, mint a téves információk és elfogultság. Továbbá eszközöket fejlesztenek a félrevezető tartalom észlelésére, és tervezik a C2PA metaadatok jövőbeli belefoglalását a Sora által generált videók származásának biztosítása érdekében.

A Sora jelenleg tesztelőknek és egy vizuális művészekből, tervezőkből és filmkészítőkből álló csoportnak érhető el visszajelzések céljából. Az OpenAI együttműködik politikai döntéshozókkal, oktatókkal és művészekkel a technológia aggodalmainak megértése és a pozitív használati esetek azonosítása érdekében. Hangsúlyozzák, hogy a való világban történő tanulás kulcsfontosságú az egyre biztonságosabb AI rendszerek létrehozásához és kiadásához.

A Sora bevezetése az OpenAI generatív AI eszközök gyors fejlesztési mintáját követi, beleértve a ChatGPT-t, a DALL-E 3-at, és most a Sorát, amely jelentős előrelépést képvisel az AI videótartalom generálásának képességében.