2024-08-28
擴散模型是即時遊戲引擎
- 研究人員推出了 GameNGen,一款由神經模型驅動的遊戲引擎,能夠進行即時互動,並展示了在單個 TPU 上模擬遊戲《毀滅戰士》時每秒超過 20 幀的性能。
- GameNGen 使用兩階段訓練過程,涉及一個用於數據收集的強化學習代理和一個用於下一幀預測的擴散模型,達到 29.4 的峰值信噪比,與有損 JPEG 壓縮相當。
- 該模型的架構包括條件增強和預訓練自編碼器的微調,以確保穩定的長期生成和改進的圖像質量,使得人類評估者難以區分真實和模擬的遊戲片段。