Перейти к основному содержимому

2024-10-11

2 доллара за H100: как лопнул пузырь аренды GPU

  • «Рынок графических процессоров (GPU) пережил значительное снижение цен: стоимость H100 GPU снизилась с $8/час до менее $2/час из-за избытка предложения и изменения динамики спроса. Факторы, способствующие этому сдвигу, включают перепродажу зарезервированных вычислительных мощностей, открытое донастройку моделей и сокращение числа новых компаний, занимающихся созданием базовых моделей, что делает аренду GPU более выгодной, чем покупку. Появление моделей с открытыми весами и более доступных альтернатив, таких как GPU от AMD и Intel, влияет на рынок, с растущим акцентом на выводы и донастройку ИИ, поддерживаемые платформами, такими как Featherless.AI, предлагающими экономически эффективные решения для ИИ.»

Реакции

  • Рынок аренды GPU испытал резкое снижение цен на H100 GPU, с $8/час до $2/час, из-за избытка предложения и снижения спроса со стороны новых компаний, занимающихся базовыми моделями.
  • Это снижение цен лопнуло пузырь аренды GPU, затронув инвесторов, которые сильно вложились в инфраструктуру GPU.
  • Статья исследует потенциал более доступного ландшафта ИИ с более дешевыми вариантами вычислений, хотя долгосрочная устойчивость этих низких цен и будущее инфраструктуры ИИ остаются неопределенными.

Тесла Роботакси

Реакции

  • Недавно Tesla продемонстрировала свой Robotaxi, подчеркивая видение автономных такси, которое контрастирует с подходом Waymo, использующим дорогостоящее оборудование, такое как LiDAR. Дизайн Robotaxi, в котором отсутствует рулевое колесо, указывает на будущее, зависящее от полной автономии, хотя он сталкивается с нормативными и технологическими вызовами. Технология Full Self-Driving (FSD) от Tesla является предметом споров: критики ставят под сомнение ее готовность к вождению без надзора, а сторонники оптимистично оценивают ее потенциал.

Начните отключение установленных расширений, которые все еще используют Manifest V2 в стабильной версии Chrome

  • Google постепенно прекращает поддержку Manifest V2 для расширений Chrome, начиная с предупреждений и отключения этих расширений на предварительных стабильных каналах с 9 октября 2024 года.
  • Пользователям рекомендуется перейти на альтернативы Manifest V3, при этом предприятиям предоставляется срок до июня 2025 года для завершения перехода с использованием политики ExtensionManifestV2Availability.
  • Процесс поэтапного отказа начался 3 июня 2024 года, и магазин Chrome Web Store не принимал новые расширения Manifest V2 с июня 2022 года для частных и с января 2022 года для публичных или незарегистрированных расширений.

Реакции

  • Chrome переходит от расширений Manifest V2 к Manifest V3, что влияет на блокировщики рекламы, такие как uBlock Origin, ограничивая их возможности. В то время как Chrome делает этот переход, такие браузеры, как Firefox, Vivaldi и Brave, намерены продолжать поддерживать Manifest V2 на данный момент. Это изменение вызвало обсуждения о контроле пользователей и конфиденциальности, и некоторые пользователи задумываются о переходе на альтернативные браузеры, чтобы сохранить эффективные функции блокировки рекламы.

Компилятор Lisp для RISC-V, написанный на Lisp

  • uLisp — это версия языка программирования Lisp, разработанная для микроконтроллеров, поддерживающая платформы такие как Arduino, Raspberry Pi и ESP32. Она включает в себя такие функции, как отладка, интерфейс SD-карты и последовательные интерфейсы I2C/SPI, с примерами для приложений, таких как мигание светодиодов и регистрация данных. Значительной особенностью является компилятор Lisp для RISC-V, который компилирует функции Lisp в машинный код, поддерживая рекурсивные функции и оптимизацию хвостовых вызовов для улучшения производительности.

Реакции

  • Компилятор Lisp для RISC-V, написанный на Lisp, находится в стадии разработки, но ему не хватает некоторых операций и функций для самокомпиляции. Компилятор поддерживает базовые функции Lisp, такие как car и cdr, но пока не завершен. uLisp выделяется своей простотой и пригодностью для микроконтроллеров, а RISC-V является привлекательной платформой для технических энтузиастов и хакеров.

Нобелевская премия мира 2024 года присуждена Нихон Хиданкё

  • Нобелевская премия мира 2024 года была присуждена Nihon Hidankyo, японской организации выживших после атомной бомбардировки, известных как Хибакуся, за их пропаганду мира без ядерного оружия. Хибакуся значительно способствовали установлению "ядерного табу", глобальной нормы против использования ядерного оружия, через свои впечатляющие свидетельства. Это признание соответствует видению Альфреда Нобеля о чествовании усилий, приносящих пользу человечеству, и продолжает вдохновлять новые поколения на ядерное разоружение.

Реакции

  • Нобелевская премия мира 2024 года была присуждена Nihon Hidankyo, японской организации, выступающей против ядерного оружия, подчеркивая постоянную угрозу ядерного вооружения на фоне глобальной напряженности. Эта награда служит напоминанием о разрушительных последствиях ядерной войны, как это было продемонстрировано в Хиросиме и Нагасаки, и подчеркивает важность разоружения. Обсуждение премии также затрагивает сложные вопросы ядерного сдерживания, международного права и геополитической динамики среди ядерных держав.

Альтернативы WordPress

  • Статья была обновлена, чтобы включить больше альтернатив систем управления контентом (CMS) из-за возросшего интереса, особенно в свете текущей ситуации с WordPress. - Список включает загружаемые варианты CMS, такие как Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail и Textpattern, исключая CMS на основе API и git. - Примечательные упоминания включают Ghost за его встроенные функции электронной почты, Kirby за его подход на основе файлов и ClassicPress как форк WordPress, управляемый сообществом, в то время как некоторые CMS, такие как Anchor, больше не поддерживаются.

Реакции

  • Jekyll на GitHub Pages рекомендуется для простых блогов с использованием Markdown, предлагая простоту использования без необходимости локальной настройки и обеспечивая переносимость контента между платформами.
  • Альтернативами WordPress для ведения блогов являются Chyrp Lite, Typecho, Quartz и Logseq, в то время как Drupal, ProcessWire и Wagtail предоставляют больше гибкости для разработчиков.
  • Статические генераторы сайтов, такие как Astro и Publii, становятся все более популярными, а для размещения изображений предлагаются такие варианты, как S3+Cloudfront или CloudFlare.

Google Play убил мою игру и не говорит мне почему

  • Туккун, независимый разработчик игр, работал над "Anti-Idle: Reborn", которая была одобрена Google и Apple и находилась в закрытом бета-тестировании в течение месяца. 7 октября 2024 года Google заблокировала аккаунт Туккуна, ссылаясь на "предыдущие нарушения" и "поведение с высоким риском", но не предоставила четкого объяснения, что повлияло на его работу и доход. Эта ситуация подчеркивает более широкую проблему, когда разработчики сталкиваются с неясными блокировками аккаунтов, что вызывает призывы к большей прозрачности и ясности со стороны таких платформ, как Google.

Реакции

  • Google Play удалила игру разработчика без объяснения причин, подчеркивая значительный контроль, который технологические компании имеют над разработчиками.
  • Похожие инциденты были зафиксированы с Amazon и Google, где аккаунты или приложения блокируются без ясных причин или адекватной поддержки.
  • Разработчикам рекомендуется диверсифицировать свои платформы для снижения рисков, так как эта ситуация подчеркивает более широкие опасения по поводу обслуживания клиентов технологическими гигантами и рисков зависимости от построения бизнеса на их платформах.

Патруль Нердлов

Реакции

  • В 2023 году в море было потеряно 221 контейнер, что является незначительным числом по сравнению с 250 миллионами, отправляемыми ежегодно, что подчеркивает масштаб глобальных судоходных операций.
  • Пластиковые гранулы, известные как нёрдлы, являются видимыми загрязнителями на пляжах и могут разлагаться на микропластик, попадая в пищевую цепь и представляя потенциальную угрозу, хотя они не являются основным источником загрязнения морей пластиком.
  • Обсуждение проблемы загрязнения пластиком подчеркивает ее сложность и глобальное воздействие, включая экспорт отходов из развитых стран в развивающиеся и потенциальную адаптацию экосистем к загрязнению пластиком, вызывая обеспокоенность по поводу будущего использования пластика.

Начальные уроки производительности CUDA

  • Мальте Скарупке обсуждает свой опыт изучения CUDA, отмечая, что это, по сути, C++ с дополнительными функциями для параллельных вычислений.
  • Ключевые уроки по оптимизации производительности CUDA включают в себя объединение памяти, понимание различных типов памяти и максимизацию параллелизма путем использования множества потоков и разделения задач на разные ядра.
  • Скарупке подчеркивает, что написание CUDA похоже на решение головоломки, где основное внимание следует уделять выполнению задач параллельно, прежде чем оптимизировать их для повышения скорости.

Реакции

  • Обсуждение сосредоточено на оптимизации кода CUDA для повышения производительности GPU, в частности для триггера эксперимента на Большом адронном коллайдере (LHC), путем управления регистрами, общей памятью и блоками потоков.
  • Он подчеркивает компромиссы между загрузкой (количеством активных потоков), использованием регистров и задержками памяти, выделяя эволюцию ограничений программирования в CUDA.
  • Разговор сравнивает производительность GPU и CPU, отмечая различия в потреблении энергии и вычислительных возможностях, и подчеркивает важность балансировки загрузки и производительности для будущих достижений в области аппаратного и программного обеспечения.

ФБР создало монету для расследования схем накачки и сброса криптовалюты.

  • ФБР разработало криптовалюту на базе Ethereum, NexFundAI, для расследования и разоблачения схем накачки и сброса криптовалют, что привело к значительным юридическим действиям. Были выдвинуты обвинения против 18 человек и организаций за мошенничество и манипуляции на рынке, при этом Комиссия по ценным бумагам и биржам нацелилась на трех маркет-мейкеров и девять других лиц за завышение цен на криптоактивы. Министерство юстиции успешно вернуло $25 миллионов мошеннических доходов, которые будут возвращены инвесторам, подчеркивая эффективность операции в борьбе с криптомошенничеством.

Реакции

  • ФБР разработало криптовалюту для расследования схем «накачки и сброса», которые являются мошенническими практиками, искусственно завышающими цену актива перед его продажей.
  • Эта инициатива вызвала дебаты о провокации и этических последствиях создания правоохранительными органами поддельных ценных бумаг.
  • Обсуждение распространяется на более широкие вопросы о легитимности криптовалют и роли правительства в регулировании цифровых валют.

NotesHub: кроссплатформенное приложение для ведения заметок на основе Markdown

  • Приложение доступно на нескольких платформах, включая iOS, Android, Windows, Mac, Apple Vision Pro и веб-версию, которая является бесплатным прогрессивным веб-приложением, работающим в офлайн-режиме. Заметки могут храниться в Git-репозиториях, с лучшей интеграцией с GitHub, а также поддерживаются варианты с самостоятельным размещением, такие как Gitea, файловые системы или iCloud Drive. Приложение поддерживает расширенный синтаксис Markdown с расширениями для создания досок Kanban, белых досок на основе Excalidraw и включает такие функции, как нотация Mermaid и ABC для музыки.

Реакции

  • NotesHub — это универсальное приложение для ведения заметок на основе Markdown, доступное на различных платформах, включая iOS, Android, Windows, Mac, Apple Vision Pro и веб. Приложение предлагает бесплатную версию в виде прогрессивного веб-приложения, в то время как нативные версии требуют единовременной оплаты, с сильной интеграцией для хранения заметок в Git-репозиториях, таких как GitHub, GitLab или Bitbucket. Оно обладает богатым синтаксисом Markdown, досками Kanban и белыми досками на основе Excalidraw, пользователи хвалят его за чистый дизайн и возможности работы в оффлайн-режиме, хотя оно не является открытым исходным кодом и имеет ограниченную поддержку Linux.

Мертвая man's switch без зависимости от вашей инфраструктуры

  • Новый проект на Go, Deadcheck, был разработан для работы в качестве переключателя мертвеца без использования cron-задач, таймеров или баз данных. Deadcheck интегрируется с PagerDuty, популярной платформой управления инцидентами, чтобы удерживать инциденты в состоянии дремоты до тех пор, пока не будет пропущена проверка, после чего он вызывает оповещение. Этот проект примечателен своим инновационным подходом к управлению оповещениями и инцидентами без традиционных зависимостей от расписания или баз данных.

Реакции

  • Deadcheck — это проект на Go, разработанный как переключатель мертвеца, устраняющий необходимость в заданиях cron или базах данных, и интегрируется с PagerDuty для управления оповещениями.
  • Проект вызвал обсуждения о механизмах «мертвой руки», включая правовые аспекты и альтернативные решения, такие как использование адвокатов или блокчейн-систем.
  • Пользователи предложили существующие сервисы, такие как Cronitor или OpsGenie, для аналогичных функций, и проект планирует расширить интеграции за пределы PagerDuty.

Понимание ограничений математического рассуждения в больших языковых моделях

  • Статья «GSM-Symbolic» Иман Мирзаде и др. исследует математические способности больших языковых моделей (LLM) с использованием эталона GSM8K. Авторы представляют GSM-Symbolic, новый эталон с символическими шаблонами, показывающий, что LLM испытывают трудности с вариациями числовых значений и дополнительными условиями в вопросах. Исследование предполагает, что LLM могут воспроизводить рассуждения из обучающих данных, а не выполнять подлинное логическое рассуждение, подчеркивая их ограничения в математическом рассуждении.

Реакции

  • Большие языковые модели (LLMs) сталкиваются с трудностями в математическом рассуждении, особенно когда задачи содержат неуместную информацию, что влияет на их производительность. Это ограничение подчеркивает зависимость LLMs от распознавания шаблонов, а не от логического мышления, что делает их менее эффективными в реальных сценариях с посторонними деталями. Несмотря на достижения, LLMs все еще испытывают трудности с различением важной информации от шума, что является критически важным навыком для практических приложений.

ARIA: Открытая мультимодальная модель с нативной смесью экспертов

  • Aria — это открытая мультимодальная нативная модель ИИ, которая интегрирует разнообразную информацию из реального мира для всестороннего понимания, превосходя такие модели, как Pixtral-12B и Llama3.2-11B, по производительности. Это модель с множеством экспертов, имеющая 3,9 миллиарда и 3,5 миллиарда активированных параметров на визуальный и текстовый токен соответственно, что улучшает её языковые и мультимодальные возможности. Веса модели и кодовая база являются открытыми, что облегчает их использование и адаптацию разработчиками и исследователями.

Реакции

  • ARIA — это новая мультимодальная модель с архитектурой Mixture-of-Experts (MoE), которая превосходит Pixtral-12B и Llama3.2-11B по производительности и скорости вывода, эффективно используя активные параметры. Несмотря на использование памяти, схожее с моделью на 25 миллиардов параметров, ARIA работает как модель на 10 миллиардов параметров и функционирует так же быстро, как модель на 4 миллиарда параметров, что делает её подходящей для устройств с достаточной памятью, таких как M2 Max. Эксперты модели сосредоточены на синтаксисе, с возможностью улучшения в выборе экспертов, и она в настоящее время доступна для тестирования, хотя некоторые пользователи столкнулись с проблемами платформы.