قدم الباحثون GameNGen، وهو محرك ألعاب مدعوم بنموذج عصبي قادر على التفاعل في الوقت الفعلي، وتمت تجربته من خلال محاكاة لعبة DOOM بسرعة تزيد عن 20 إطارًا في الثانية على وحدة معالجة واحدة.
تستخدم GameNGen عملية تدريب من مرحلتين تتضمن وكيل التعلم المعزز لجمع البيانات ونموذج الانتشار لتوقع الإطار التالي، محققة نسبة PSNR تبلغ 29.4، وهي قابلة للمقارنة مع ضغط JPEG الفاقد.
تشمل بنية النموذج تعزيزات التكييف وضبطًا دقيقًا لمشفّر تلقائي مدرّب مسبقًا لضمان توليد مستقر طويل الأمد وتحسين جودة الصورة، مما يجعل من الصعب على المقيمين البشريين التمييز بين مقاطع الألعاب الحقيقية والمحاكاة.
تقوم نماذج الانتشار بتوليد الإطارات بناءً على الإطارات السابقة وإجراءات المستخدم ولكنها لا تدعم إدخال المستخدم في الوقت الفعلي لإجراء تعديلات ديناميكية.
تم تدريب هذه النماذج على مجموعة بيانات كبيرة من لعبة DOOM، وتنتج إطارات مشروطة بالإطارات الحالية وإجراءات المستخدم، مما يشبه تسجيلًا عصبيًا أكثر من كونه محاكاة تفاعلية.
بينما تعتبر التكنولوجيا مثيرة للإعجاب، فإنها تواجه قيودًا مثل الصيانة غير المتسقة لحالة اللعبة الداخلية، مما يبرز كل من إمكانياتها وتحدياتها لمحاكاة الألعاب.