Pular para o conteúdo principal

2024-09-13

Notas sobre os novos modelos de cadeia de pensamento o1 da OpenAI

  • OpenAI lançou dois novos modelos, o1-preview e o1-mini, codinome 'strawberry', que oferecem capacidades de raciocínio aprimoradas através de um padrão de solicitação em cadeia de pensamento.
  • Esses modelos são reservados para contas de nível 5 (mais de $1.000 em créditos de API) e introduzem "tokens de raciocínio" que são cobrados, mas não são visíveis na resposta da API, gerando alguma insatisfação devido à falta de transparência.
  • As novas modelos podem lidar melhor com prompts complexos e têm aumentadas as permissões de tokens de saída, expandindo as tarefas potenciais solucionáveis por grandes modelos de linguagem (LLMs).

Reações

  • Os novos modelos de cadeia de pensamento o1 da OpenAI ainda produzem alucinações, como bibliotecas e funções inexistentes, e frequentemente fornecem fatos incorretos.
  • Os usuários observam que, embora as capacidades de raciocínio tenham melhorado, os modelos ainda falham em verificar a precisão factual de seus resultados, necessitando de uma verificação dupla por parte do usuário.
  • Alguns usuários comparam os modelos a estagiários ingênuos, mas inteligentes, sugerindo que podem ser úteis com a orientação adequada, embora não tenham a capacidade de fazer perguntas esclarecedoras ou admitir incertezas, o que afeta sua confiabilidade.

Detetives de dados que identificaram má conduta em pesquisa são absolvidos de difamação

  • Um tribunal absolveu os pesquisadores do Data Colada da acusação de difamação por identificarem dados manipulados em uma investigação da Harvard Business School.
  • Harvard ainda enfrentará julgamento sobre sua gestão do caso, apesar de confirmar a má conduta da professora Francesca Gino, que está em licença administrativa e pode perder a titularidade.
  • A corte decidiu que conclusões respaldadas por evidências não constituem difamação, absolvendo completamente a equipe do Data Colada devido à sua abordagem cautelosa e baseada em evidências.

Reações

  • Detetives de dados acusados de difamação por identificar má conduta em pesquisas foram absolvidos, com o caso sendo arquivado antes da fase de descoberta.
  • A corte decidiu que conclusões fundamentadas em evidências sobre dados fabricados não constituem difamação, apoiando a integridade científica.
  • As rés arrecadaram mais de $300 mil no GoFundMe para sua defesa legal, destacando os altos custos e o impacto emocional das ações de difamação nos EUA.

Trabalhadores da Boeing votam por greve

  • Dezenas de milhares de operários da Boeing votaram esmagadoramente a favor da greve após rejeitarem uma oferta de contrato, com 96% de apoio do Distrito 751 da Associação Internacional de Operários e Trabalhadores Aeroespaciais.
  • A greve, que começou fora das fábricas da Boeing no estado de Washington, pode custar à empresa cerca de US$ 1 bilhão por semana e atrapalhar sua recuperação de desafios financeiros e de segurança.
  • Apesar de um aumento salarial proposto de 25% ao longo de quatro anos e benefícios aprimorados, o acordo não atendeu a outras demandas sindicais; a Boeing está pronta para retornar às negociações, e a administração Biden está monitorando a situação.

Reações

  • Boeing trabalhadores votaram para entrar em greve, com 96% rejeitando uma proposta que incluía um aumento salarial significativo.
  • As máquinas sindicais estão exigindo melhores salários, condições de trabalho aprimoradas e que a Boeing 'pare de infringir a lei.'
  • A greve destaca uma insatisfação mais ampla com a gestão da Boeing, criticada por priorizar lucros em detrimento da qualidade e segurança da engenharia, contribuindo para problemas como os acidentes do 737 Max.

FDA autoriza o primeiro software de aparelho auditivo de venda livre

Reações

  • A FDA aprovou o primeiro software de aparelho auditivo de venda livre, permitindo que os AirPods sejam usados como aparelhos auditivos, potencialmente reduzindo o estigma e aumentando a acessibilidade.
  • Espera-se que esta aprovação reduza os custos e incentive mais pessoas a tratar sua perda auditiva, embora persistam preocupações sobre a duração da bateria e a percepção social.
  • Usuários relataram experiências positivas com os recursos de acessibilidade dos aparelhos auditivos e AirPods, marcando um passo significativo para tornar os aparelhos auditivos mais acessíveis e aceitos.

Todo o pessoal da editora de jogos Annapurna Interactive teria renunciado

  • Todo o pessoal da Annapurna Interactive, incluindo o ex-presidente Nathan Gary, renunciou após uma tentativa malsucedida de transformar a empresa em uma entidade independente.
  • Os jogos e projetos existentes da Annapurna Interactive permanecerão sob a empresa, com Hector Sanchez recentemente nomeado como presidente de interatividade e novas mídias.
  • Annapurna planeja integrar suas operações de jogos com suas divisões de cinema, TV e teatro, continuando a publicar jogos como Lorelei and the Laser Eyes e Open Roads, com títulos futuros como Blade Runner 2033: Labyrinth.

Reações

  • A equipe inteira da Annapurna Interactive, uma editora de jogos, renunciou devido a negociações fracassadas com sua empresa-mãe, Annapurna Pictures, sobre integração financeira.
  • A equipe e os executivos preferiram se desmembrar para manter o controle sobre sua direção criativa, especialmente após o sucesso de jogos como 'Outer Wilds' e 'Stray.'
  • Esta demissão em massa destaca a tensão entre a independência criativa e as pressões financeiras dentro da indústria de jogos.

Seu startup precisa de uma infraestrutura de nuvem complexa?

  • Peter Levels defende uma infraestrutura mais simples, usando servidores únicos em vez de configurações complexas na nuvem, para focar no ajuste do produto ao mercado, conforme discutido no Podcast de Lex Friedman.
  • Dois estudos de caso destacam as armadilhas de configurações excessivamente complicadas: um com funções Lambda excessivas e outro com microserviços desnecessários, ambos prejudicando o desenvolvimento de funcionalidades.
  • Servidores modernos e ferramentas como o Docker Compose podem fornecer soluções poderosas, gerenciáveis e econômicas, permitindo que pequenas equipes se concentrem em criar ótimos produtos em vez de gerenciar infraestruturas complexas.

Reações

  • Startups frequentemente adotam infraestruturas complexas de nuvem como Kubernetes para escalabilidade, mas isso pode levar a baixa qualidade e altos custos devido a decisões imaturas da equipe.
  • Alguns profissionais experientes argumentam que configurações mais simples e reproduzíveis usando ferramentas como Puppet e sistemas LTS (Long-Term Support) podem ser mais eficientes e econômicas.
  • A discussão destaca os prós e contras entre abordagens modernas nativas da nuvem e métodos tradicionais e determinísticos para gerenciar a infraestrutura.

Portando SBCL para o Nintendo Switch

  • Charles Zhang e Shinmera têm trabalhado por dois anos para portar o motor de jogo Trial para o Nintendo Switch, focando na adaptação do runtime Common Lisp.
  • Apesar de compilar e executar com sucesso o código Lisp no Switch, problemas não resolvidos incluem coleta de lixo e saída de áudio, com o projeto custando cerca de $17.000.
  • As capacidades do chip ARM64 Cortex-A57 do Switch e o suporte ao OpenGL tornaram a portabilidade viável, mas ainda existem desafios, como a interface com o sistema operacional proprietário do Switch e a otimização da compilação CLOS.

Reações

  • SBCL (Steel Bank Common Lisp) está sendo portado para o Nintendo Switch, o que é significativo para o desenvolvimento de jogos em Common Lisp devido à sua avaliação interativa de código e ciclos rápidos de desenvolvimento.
  • O projeto é liderado por Shinmera, que está lidando com a portabilidade e a arquitetura de construção, destacando os desafios técnicos e os benefícios potenciais de executar SBCL em hardware de jogos especializado.
  • As SDKs (Kits de Desenvolvimento de Software) oficiais da Nintendo são necessários para publicar jogos no Switch, pois SDKs caseiros não são suportados para lançamentos em consoles de varejo.

Quem é o dono da Nebula?

  • Nebula é um serviço de streaming de vídeo sob demanda focado em conteúdo educacional, criado por criadores de conteúdo, mas não realmente de propriedade deles.
  • Standard Broadcast possui 83,125% da Nebula, CuriosityStream possui 16,875%, e os criadores possuem diretamente 0%, embora recebam 50% dos lucros e receitas de uma venda.
  • Criadores têm 'equidade sombra', o que significa que são compensados como proprietários sem possuir ações reais, levantando questões sobre o alinhamento da plataforma com os valores dos criadores.

Reações

  • Nebula é de propriedade da Standard Broadcast LLC, com 44 criadores possuindo participação indireta em vez de propriedade direta para evitar problemas logísticos e fiscais.
  • Se a Nebula for vendida, os criadores recebem 50% dos lucros, mas alguns argumentam que a estrutura carece de transparência e verdadeira propriedade cooperativa.
  • Críticos afirmam que o marketing é enganoso, pois os criadores não têm participação direta ou controle sobre a Nebula.

FlowTracker – Acompanhe o fluxo de dados em programas Java

  • FlowTracker é um agente Java projetado para rastrear o fluxo de dados dentro de programas Java, ajudando a entender a origem e a importância das saídas.
  • Oferece um tutorial em vídeo e uma demonstração ao vivo para os usuários explorarem suas funcionalidades.
  • Mais informações e acesso à ferramenta podem ser encontrados na sua página do GitHub: https://github.com/coekie/flowtracker.

Reações

  • FlowTracker é um agente Java projetado para rastrear o fluxo de dados em programas Java, ajudando na compreensão das saídas do programa.
  • Os usuários comparam o FlowTracker a ferramentas como jitwatch e rastreamento dinâmico de taint, destacando seu potencial para solução de problemas e rastreamento de origem de dados.
  • A demonstração exibe sua capacidade de rastrear um elemento HTML até a instrução SQL que o adicionou ao banco de dados, gerando entusiasmo para sua integração em vários ambientes de desenvolvimento.

Criptografia de curva elíptica “25519” de melhor desempenho

  • A AWS aprimorou o desempenho e a correção da criptografia de curva elíptica '25519' em sua biblioteca de código aberto, AWS LibCrypto (AWS-LC), por meio de raciocínio automatizado e otimizações específicas para CPU.
  • Essas melhorias, baseadas no BoringSSL do Google, incluem ganhos de desempenho significativos para os algoritmos x25519 e Ed25519 em CPUs x86_64 e Arm64, com operações de assinatura Ed25519 vendo um aumento de 108% e operações x25519 melhorando em 113%.
  • As melhorias garantem execução em tempo constante para prevenir ataques de canal lateral, com a correção verificada pela biblioteca s2n-bignum e pelo provador de teoremas HOL Light, tornando o AWS-LC uma escolha robusta para implementações criptográficas seguras.

Reações

  • Criptografia de curva elíptica "25519" da Amazon demonstra melhorias significativas de desempenho, especialmente com uma implementação otimizada para AVX512 pela equipe Firedancer superando o OpenSSL.
  • As x25519 é usado em TLS 1.3 e esquemas híbridos de SSH para acordo de chave pós-quântica, destacando sua importância nos protocolos criptográficos modernos.
  • Conhecido por sua otimização de blockchain, o código do Firedancer é elogiado por seu desempenho e práticas de programação seguras, contribuindo para a adoção mais ampla do ed25519 em vez do RSA para chaves SSH devido ao melhor desempenho, segurança e compatibilidade.

Convite de Calendário Zero-Click – Cadeia de vulnerabilidade crítica de zero-click no macOS

  • A vulnerabilidade de zero clique no Calendário do macOS permitia que atacantes adicionassem ou excluíssem arquivos dentro do sandbox do Calendário, potencialmente levando à execução de código malicioso e comprometendo os dados do iCloud Photos.
  • Apple corrigiu essas vulnerabilidades entre outubro de 2022 e setembro de 2023, abordando problemas como gravação/exclusão arbitrária de arquivos, execução remota de código e acesso a dados sensíveis de fotos.
  • A cadeia de exploração envolveu múltiplas etapas para contornar a segurança do macOS, incluindo evasão de sandbox, bypass do Gatekeeper e a circunvenção da proteção TCC, com correções implementadas em várias atualizações do macOS.

Reações

  • Uma vulnerabilidade crítica de zero-clique no macOS permite que atacantes enviem convites de calendário maliciosos com anexos de arquivos, potencialmente roubando Fotos do iCloud sem interação do usuário.
  • Os usuários estão questionando a segurança de tais convites e sugerindo a inclusão de remetentes específicos em uma lista de permissões como precaução.
  • Apple tem sido lenta em pagar recompensas por essas vulnerabilidades, levantando preocupações sobre seu compromisso com a privacidade do usuário e atualizações oportunas.

Notepat – Computador Estético

Reações

  • "Notepat" é um projeto de arte digital de Jeffrey Scudder, acessível através do site aesthetic.computer, apresentando um ambiente de computação retrô e ferramentas únicas para a criação de arte digital.
  • As interações do projeto incluem elementos como um aplicativo 'notepat' para criação musical, com comandos e um layout de teclado distinto baseado na escala cromática.
  • Os usuários podem explorar várias funcionalidades, incluindo experiências de realidade virtual como 'Freaky Flowers', e o projeto gerou um interesse significativo por sua abordagem inovadora e artística às ferramentas digitais.

Meta alimentou sua IA com tudo o que os adultos postaram publicamente desde 2007

  • Meta tem usado postagens e fotos públicas do Facebook e Instagram desde 2007 para treinar seus modelos de IA, a menos que os usuários definam suas postagens como privadas.
  • Os usuários europeus podem optar por não participar desse uso de dados devido às leis locais de privacidade, mas os usuários de outras regiões, incluindo a Austrália, não têm essa opção.
  • Meta não forneceu detalhes claros sobre as especificidades do uso e coleta de dados, levantando preocupações de privacidade entre os usuários.

Reações

  • Meta tem usado postagens públicas de adultos desde 2007 para treinar sua IA, gerando um debate sobre a ética e a legalidade do uso de dados públicos para treinamento de IA.
  • Céticos se preocupam com o trabalho dos criadores sendo copiado sem consentimento, levantando questões sobre uso justo e leis de direitos autorais.
  • A discussão destaca a tensão entre o progresso tecnológico e a proteção dos direitos individuais.

Deslizamento de terra na Groenlândia causou onda anômala que sacudiu a Terra por nove dias

  • Em agosto de 2023, um deslizamento de terra no Fiorde Dickson, na Groenlândia, causou um tsunami de 110 metros de altura, criando uma onda estacionária que durou nove dias.
  • Os sismólogos inicialmente identificaram a onda como um "objeto sísmico não identificado" (USO) com uma frequência de 11 milihertz, desencadeada pelo afinamento das geleiras induzido pelas mudanças climáticas.
  • As características e a forma única do fiorde aprisionaram a energia da onda, destacando o impacto significativo das mudanças climáticas nos fenômenos geológicos da Terra.

Reações

  • A queda de uma encosta na Groenlândia desencadeou um tsunami de 110 metros de altura, inicialmente notado quando um ex-funcionário viu uma estação de pesquisa SIRIUS abandonada ser arrastada após um navio de cruzeiro encalhar.
  • A tsunami, inicialmente com 7 metros de altura, foi detectado dentro de uma semana devido ao incidente do cruzeiro, embora os dados sísmicos eventualmente o revelassem.
  • Dispositivos sismológicos em todo o mundo registraram o evento, que durou nove dias, destacando como ocorrências aleatórias podem levar a descobertas significativas.

Wallops: Um cliente IRC moderno para o clássico Mac OS

  • Wallops, um cliente IRC moderno para o clássico Mac OS, lançou a versão 2.0, compatível com o System 6 e versões mais recentes, e inclui atualizações significativas e correções de bugs.
  • Os principais recursos incluem uma interface com abas para múltiplas conexões, canais e mensagens privadas, redimensionamento de janelas e classificação otimizada da lista de nicks para canais grandes.
  • Wallops 2.0 também introduz novos comandos, elementos de interface aprimorados e melhorias de desempenho, tornando-o uma ferramenta robusta para usuários de IRC em sistemas clássicos da Mac.

Reações

  • Wallops é um cliente IRC (Internet Relay Chat) moderno projetado para o clássico Mac OS, gerando interesse entre entusiastas da computação vintage.
  • A liberação gerou empolgação devido à raridade de novos softwares para sistemas antigos, com os usuários relembrando suas experiências com os Macs clássicos.
  • Alguns usuários notaram melhorias na emulação de Mac, sugerindo ferramentas como o MAME (Multiple Arcade Machine Emulator) para aqueles que não possuem hardware vintage funcional.