Авторы предлагают метод генерации многоракурсных оптических иллюзий с использованием предварительно обученных диффузионных моделей.
Метод поддерживает различные преобразования, такие как вращение, переворачивание, инверсия цвета, перекос, перестановка па злов и случайные перестановки.
Метод предполагает выравнивание и усреднение оценок шума, полученных при различных ракурсах или трансформациях изображения, для получения шага диффузии.
Авторы обсуждают условия, которым должны удовлетворять виды, чтобы метод работал, включая линейность и статистическую согласованность.
Использование ортогональных преобразований, в частности матриц перестановок, позволяет создавать интерпретируемые и визуально значимые оптические иллюзии.
В статье приводятся примеры и ссылки на соответствующие работы в этой области.
В статье рассматривается применение диффузионных моделей и генеративного ИИ для создания визуальных анаграмм, оптических иллюзий и иллюзий изображений.
В настоящее время ведутся дебаты вокруг использования произведений искусства, созданных искусственным интеллектом, и потенциала генеративного ИИ в создании головоломок с множеством решений.
В комментариях затрагиваются различные темы, включая восхищение приведенными примерами, интерес к различным типам иллюзий и обсуждение стоимости доступа к большому объему оперативной памяти и времени работы GPU. В разговоре также кратко упоминаются видеоигры и тест-драйв автомобилей.