Pular para o conteúdo principal

2024-10-11

US$2 H100s: Como a Bolha de Aluguel de GPUs Estourou

  • O mercado de GPUs experimentou uma queda significativa nos preços, com as GPUs H100 diminuindo de $8/h para menos de $2/h devido ao excesso de oferta e às dinâmicas de demanda em mudança. - Fatores que contribuem para essa mudança incluem revendas de computação reservada, ajuste fino de modelos abertos e uma redução nas novas empresas de modelos de fundação, tornando o aluguel de GPUs mais favorável do que a compra. - O surgimento de modelos de peso aberto e alternativas mais acessíveis, como GPUs da AMD e Intel, está influenciando o mercado, com uma ênfase crescente em inferência de IA e ajuste fino, apoiada por plataformas como Featherless.AI que oferecem soluções de IA econômicas.

Reações

  • O mercado de aluguel de GPUs experimentou uma queda dramática de preço para GPUs H100, de $8/h para $2/h, devido a um excesso de oferta e à diminuição da demanda de novas empresas de modelos de fundação.
  • Esta redução de preço estourou a bolha de aluguel de GPU, afetando investidores que investiram pesadamente em infraestrutura de GPU.
  • O artigo explora o potencial para um cenário de IA mais acessível com opções de computação mais baratas, embora a sustentabilidade a longo prazo desses preços baixos e o futuro da infraestrutura de IA sejam incertos.

Tesla Robotaxi

Reações

  • Recentemente, a Tesla apresentou seu Robotaxi, destacando uma visão para táxis autônomos que contrasta com a abordagem da Waymo, que utiliza hardware caro como o LiDAR. O design do Robotaxi, que não possui volante, indica um futuro dependente de autonomia total, embora enfrente desafios regulatórios e tecnológicos. A tecnologia Full Self-Driving (FSD) da Tesla é um tema de debate, com críticos questionando sua prontidão para condução sem supervisão e apoiadores otimistas quanto ao seu potencial.

Comece a desativar as extensões instaladas que ainda usam o Manifest V2 no Chrome estável

  • Google está eliminando gradualmente o Manifest V2 para extensões do Chrome, com avisos e desativação dessas extensões começando em canais pré-estáveis a partir de 9 de outubro de 2024.
  • Os usuários são incentivados a fazer a transição para alternativas do Manifest V3, com as empresas tendo até junho de 2025 para concluir a transição usando a política ExtensionManifestV2Availability.
  • O processo de descontinuação começou em 3 de junho de 2024, e a Chrome Web Store não aceita novas extensões Manifest V2 desde junho de 2022 para extensões privadas e janeiro de 2022 para extensões públicas ou não listadas.

Reações

  • Chrome está fazendo a transição de extensões do Manifest V2 para o Manifest V3, afetando bloqueadores de anúncios como o uBlock Origin ao limitar suas capacidades. Enquanto o Chrome está fazendo essa mudança, navegadores como Firefox, Vivaldi e Brave pretendem continuar suportando o Manifest V2 por enquanto. Essa mudança gerou discussões sobre controle do usuário e privacidade, com alguns usuários contemplando a troca para navegadores alternativos para manter recursos eficazes de bloqueio de anúncios.

Um compilador Lisp para RISC-V escrito em Lisp

  • uLisp é uma versão da linguagem de programação Lisp projetada para microcontroladores, suportando plataformas como Arduino, Raspberry Pi e ESP32. Inclui recursos como depuração, interface de cartão SD e interfaces seriais I2C/SPI, com exemplos para aplicações como piscar de LED e registro de dados. Um recurso significativo é o compilador Lisp para RISC-V, que compila funções Lisp em código de máquina, suportando funções recursivas e otimização de chamadas de cauda para melhorar o desempenho.

Reações

  • A compilador Lisp para RISC-V, escrito em Lisp, está em desenvolvimento, mas carece de certas operações e funções para ser auto-compilável. O compilador suporta funções básicas de Lisp como car e cdr, mas ainda não está completo. O uLisp é destacado por sua simplicidade e adequação para microcontroladores, com o RISC-V sendo uma plataforma atraente para entusiastas de tecnologia e hackers.

Nobel da Paz de 2024 concedido à Nihon Hidankyo

  • Ao Nihon Hidankyo, uma organização japonesa de sobreviventes da bomba atômica, conhecidos como Hibakusha, foi concedido o Prêmio Nobel da Paz de 2024 por sua defesa de um mundo livre de armas nucleares. Os Hibakusha contribuíram significativamente para o estabelecimento do "tabu nuclear", uma norma global contra o uso de armas nucleares, através de seus testemunhos impactantes. Este reconhecimento está alinhado com a visão de Alfred Nobel de honrar esforços que beneficiam a humanidade e continua a inspirar novas gerações em direção ao desarmamento nuclear.

Reações

  • O Prêmio Nobel da Paz de 2024 foi concedido à Nihon Hidankyo, uma organização japonesa que advoga contra armas nucleares, destacando a ameaça persistente das armas nucleares em meio a tensões globais. Este prêmio serve como um lembrete do impacto devastador da guerra nuclear, exemplificado por Hiroshima e Nagasaki, e enfatiza a importância do desarmamento. A discussão sobre o prêmio também envolve as complexidades da dissuasão nuclear, do direito internacional e das dinâmicas geopolíticas entre as potências nucleares.

Alternativas ao WordPress

  • O artigo foi atualizado para incluir mais alternativas de Sistemas de Gerenciamento de Conteúdo (CMS) devido ao aumento do interesse, especialmente à luz da situação atual do WordPress. - A lista apresenta opções de CMS para download como Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail e Textpattern, excluindo CMSs baseados em API e git. - Menções notáveis incluem o Ghost por seus recursos de e-mail integrados, o Kirby por sua abordagem baseada em arquivos, e o ClassicPress como um fork do WordPress liderado pela comunidade, enquanto alguns CMSs como o Anchor não são mais mantidos.

Reações

  • Jekyll no GitHub Pages é recomendado para blogs simples usando Markdown, oferecendo facilidade de uso sem exigir configuração local e permitindo a portabilidade de conteúdo entre plataformas.
  • Alternativas ao WordPress para blogs incluem Chyrp Lite, Typecho, Quartz e Logseq, enquanto Drupal, ProcessWire e Wagtail oferecem mais flexibilidade para desenvolvedores.
  • Geradores de sites estáticos, como Astro e Publii, estão se tornando cada vez mais populares, e para hospedagem de imagens, opções como S3+Cloudfront ou CloudFlare são sugeridas.

Google Play matou meu jogo e não me dirá por quê

  • Tukkun, um desenvolvedor de jogos indie, tem trabalhado em "Anti-Idle: Reborn", que foi aprovado pelo Google e Apple, e esteve em Beta Fechado por um mês. Em 7 de outubro de 2024, o Google encerrou a conta de Tukkun citando "violações anteriores" e "Comportamento de Alto Risco", mas não forneceu uma explicação clara, impactando seu trabalho e renda. Esta situação destaca um problema mais amplo onde desenvolvedores enfrentam encerramentos de contas vagos, levando a pedidos por mais transparência e clareza de plataformas como o Google.

Reações

  • Google Play removeu o jogo de um desenvolvedor sem explicação, destacando o controle significativo que as empresas de tecnologia têm sobre os desenvolvedores.
  • Incidentes semelhantes foram relatados com a Amazon e o Google, onde contas ou aplicativos são banidos sem razões claras ou suporte adequado.
  • Os desenvolvedores são incentivados a diversificar suas plataformas para mitigar riscos, já que esta situação destaca preocupações mais amplas sobre o atendimento ao cliente dos gigantes da tecnologia e os riscos de dependência de construir negócios em suas plataformas.

Nurdle Patrol

Reações

  • Em 2023, 221 contêineres de carga foram perdidos no mar, um número pequeno em comparação com os 250 milhões enviados anualmente, destacando a escala das operações de transporte marítimo global.
  • Pelotas de plástico, conhecidas como nurdles, são poluentes visíveis nas praias e podem se degradar em microplásticos, entrando na cadeia alimentar e representando um potencial perigo, embora não sejam a principal fonte de poluição plástica marinha.
  • A discussão sobre a poluição plástica enfatiza sua complexidade e impacto global, incluindo a exportação de problemas de resíduos de países desenvolvidos para países em desenvolvimento e a potencial adaptação dos ecossistemas à poluição plástica, levantando preocupações sobre o uso futuro de plástico.

Lições Iniciais de Desempenho CUDA

  • Malte Skarupke discute sua experiência aprendendo CUDA, observando que é essencialmente C++ com recursos adicionais para computação paralela.
  • Principais lições para otimizar o desempenho do CUDA incluem o agrupamento de memória, a compreensão dos vários tipos de memória e a maximização do paralelismo usando muitos threads e separando tarefas em diferentes kernels.
  • Skarupke enfatiza que escrever CUDA é semelhante a resolver um quebra-cabeça, onde o foco principal deve ser executar tarefas em paralelo antes de otimizar para velocidade.

Reações

  • A discussão foca em otimizar o código CUDA para desempenho em GPU, especificamente para um gatilho de experimento do LHC (Grande Colisor de Hádrons), gerenciando registradores, memória compartilhada e blocos de threads.
  • Enfatiza as compensações entre ocupação (o número de threads ativas), uso de registradores e latências de memória, destacando a evolução das restrições de programação em CUDA.
  • A conversa compara o desempenho de GPU e CPU, observando diferenças no consumo de energia e nas capacidades computacionais, e enfatiza a importância de equilibrar ocupação e desempenho para avanços futuros em hardware e software.

O FBI criou uma moeda para investigar esquemas de pump-and-dump de criptomoedas

  • O FBI desenvolveu uma criptomoeda baseada em Ethereum, a NexFundAI, para investigar e expor esquemas de pump-and-dump de criptomoedas, levando a ações legais significativas. Foram apresentadas acusações contra 18 indivíduos e entidades por fraude e manipulação de mercado, com a Comissão de Valores Mobiliários visando três formadores de mercado e outros nove por inflacionar os preços de ativos criptográficos. O Departamento de Justiça recuperou com sucesso $25 milhões em proventos fraudulentos, que serão devolvidos aos investidores, destacando a eficácia da operação no combate à fraude em criptomoedas.

Reações

  • O FBI desenvolveu uma criptomoeda para investigar esquemas de pump-and-dump, que são práticas fraudulentas que inflacionam artificialmente o preço de um ativo antes de vendê-lo.
  • Esta iniciativa gerou debates sobre armadilhas e as implicações éticas da aplicação da lei ao criar valores mobiliários falsos.
  • A discussão se estende a preocupações mais amplas sobre a legitimidade das criptomoedas e o papel do governo na regulamentação das moedas digitais.

NotesHub: aplicativo de anotações multiplataforma baseado em Markdown

  • O aplicativo está disponível em várias plataformas, incluindo iOS, Android, Windows, Mac, Apple Vision Pro e Web, sendo a versão Web um Progressive Web App gratuito que funciona offline. - As notas podem ser armazenadas em repositórios Git, com a melhor integração com o GitHub, e também suportam opções auto-hospedadas como Gitea, sistemas de arquivos ou iCloud Drive. - O aplicativo suporta sintaxe rica em Markdown com extensões para criar quadros Kanban, quadros brancos baseados em Excalidraw, e inclui recursos como notação musical Mermaid e ABC.

Reações

  • NotesHub é um aplicativo versátil de anotações baseado em Markdown, disponível em várias plataformas, incluindo iOS, Android, Windows, Mac, Apple Vision Pro e Web. O aplicativo oferece uma versão gratuita de Progressive Web App, enquanto as versões nativas exigem um pagamento único, com forte integração para armazenar notas em repositórios Git como GitHub, GitLab ou Bitbucket. Ele apresenta uma rica sintaxe Markdown, quadros Kanban e quadros brancos baseados em Excalidraw, com usuários elogiando seu design limpo e capacidades offline, embora não seja de código aberto e tenha suporte limitado para Linux.

Interruptor de homem morto sem dependência da sua infraestrutura

  • Um novo projeto em Go, Deadcheck, foi desenvolvido para funcionar como um interruptor de homem morto sem depender de cron jobs, temporizadores ou bancos de dados. O Deadcheck integra-se com o PagerDuty, uma plataforma popular de gerenciamento de incidentes, para manter os incidentes em modo soneca até que um check-in seja perdido, momento em que ele dispara um alerta. Este projeto é notável por sua abordagem inovadora para gerenciar alertas e incidentes sem dependências tradicionais de agendamento ou banco de dados.

Reações

  • Deadcheck é um projeto em Go projetado como um interruptor de homem morto, eliminando a necessidade de cron jobs ou bancos de dados, e integra-se com o PagerDuty para gerenciar alertas.
  • O projeto gerou discussões sobre switches de homem morto, incluindo aspectos legais e soluções alternativas, como o uso de advogados ou sistemas de blockchain.
  • Os usuários sugeriram serviços existentes como Cronitor ou OpsGenie para funcionalidades semelhantes, e o projeto planeja expandir as integrações além do PagerDuty.

Compreendendo as Limitações do Raciocínio Matemático em Grandes Modelos de Linguagem

  • O artigo 'GSM-Symbolic' de Iman Mirzadeh et al. investiga as capacidades de raciocínio matemático de Modelos de Linguagem de Grande Escala (LLMs) usando o benchmark GSM8K. Os autores introduzem o GSM-Symbolic, um novo benchmark com templates simbólicos, mostrando que os LLMs têm dificuldade com variações nos valores numéricos e cláusulas adicionais nas perguntas. O estudo sugere que os LLMs podem replicar o raciocínio dos dados de treinamento em vez de realizar um raciocínio lógico genuíno, destacando suas limitações no raciocínio matemático.

Reações

  • Os Modelos de Linguagem de Grande Escala (LLMs) enfrentam desafios no raciocínio matemático, especialmente quando os problemas incluem informações irrelevantes, o que afeta seu desempenho. Essa limitação destaca a dependência dos LLMs no reconhecimento de padrões em vez do raciocínio lógico, tornando-os menos eficazes em cenários do mundo real com detalhes supérfluos. Apesar dos avanços, os LLMs ainda têm dificuldade em distinguir informações importantes do ruído, uma habilidade crítica necessária para aplicações práticas.

ARIA: Um Modelo Aberto Multimodal de Mistura de Especialistas Nativo

  • Aria é um modelo de IA nativo multimodal aberto que integra diversas informações do mundo real para uma compreensão abrangente, superando modelos como Pixtral-12B e Llama3.2-11B em desempenho. É um modelo de mistura de especialistas com 3,9 bilhões e 3,5 bilhões de parâmetros ativados por token visual e de texto, respectivamente, aprimorando suas capacidades de linguagem e multimodal. Os pesos e a base de código do modelo são de código aberto, facilitando a adoção e adaptação por desenvolvedores e pesquisadores.

Reações

  • ARIA é um novo modelo multimodal nativo de Mistura de Especialistas (MoE) que supera o Pixtral-12B e o Llama3.2-11B em desempenho e velocidade de inferência ao utilizar eficientemente parâmetros ativos. Apesar de ter um uso de memória semelhante a um modelo de 25B, o ARIA atua como um modelo de 10B e opera tão rapidamente quanto um modelo de 4B, tornando-o adequado para dispositivos com memória adequada, como um M2 Max. Os especialistas do modelo se concentram na sintaxe, com espaço para melhorias na seleção de especialistas, e atualmente está disponível para testes, embora alguns usuários tenham encontrado problemas na plataforma.