„A kutatók bemutatták a GameNGen-t, egy neurális modell által vezérelt játékmotort, amely képes valós idejű interakcióra, amit azzal demonstráltak, hogy a DOOM játékot több mint 20 képkocka/másodperc sebességgel szimulálták egyetlen TPU-n.”
„A GameNGen egy kétfázisú képzési folyamatot alkalmaz, amely egy RL-ügynököt használ az adatok gyűjtésére és egy diffúziós modellt a következő képkocka előrejelzésére, elérve egy 29,4-es PSNR értéket, ami összehasonlítható a veszteséges JPEG tömörítéssel.”
„A modell architektúrája magában foglalja a kondicionáló augmentációkat és egy előre betanított autoenkóder finomhangolását, hogy biztosítsa a stabil hosszú távú generálást és a jobb képminőséget, így nehézséget okoz az emberi értékelők számára a valós és a szimulált játékklipek megkülönböztetése.”
„A diffúziós modellek a korábbi képkockák és a felhasználói műveletek alapján generálnak új képkockákat, de nem támogatják a valós idejű felhasználói bevitelt a dinamikus módosításokhoz.”