O StableLM é um novo modelo de linguagem de código aberto concebido para tarefas de processamento de linguagem natural.
O modelo é único na medida em que permite aos utilizadores treiná-lo e afiná-lo nos seus próprios conjuntos de dados específicos, aumentando assim o desempenho na aprendizagem de línguas específicas de tarefas.
A sua arquitectura é baseada no BERT, e foi concebida para minimizar o esquecimento catastrófico.
O modelo é pré-treinado num grande corpo de texto, incluindo a Wikipédia e o Common Crawl.
O software é fácil de usar e pode ser acedido no GitHub, com documentação disponível para ajudar os utilizadores a começar.
O StableLM já foi utilizado em várias aplicações, incluindo classificação de texto e análise de sentimentos.
Um novo modelo de linguagem de código aberto chamado StableLM foi lançado pela Stability.AI, com modelos que vão de 3B a 65B parâmetros e uma largura de contexto de 4096.
A avaliação do modelo tem recebido críticas, mas é uma boa opção para os programadores que querem melhorar o modelo, uma vez que é de código aberto.
O modelo alfa StableLM está a ser testado e espera-se que tenha um desempenho superior ao do Pythia 6.9B e será treinado em até 1,5 triliões de fichas.
Os modelos maiores aprendem mais depressa mas são propensos ao sobreajustamento e as corporações fazem os consumidores pagar adiantadamente pelo poder de computação.
As estruturas ML optimizadas estão a tornar-se mais acessíveis no hardware de consumo, mas os bons modelos de linguagem requerem actualmente GPUs dispendiosos que fazem das APIs de nuvem a única opção.
Servir modelos de linguagem através de APIs permite uma inferência altamente optimizada, mas a computação local permite mais privacidade em aplicações de IA.
Os investigadores de Stanford lançaram o StableLM sob uma licença de código aberto, que tem sido recebida com opiniões diversas.
O desenvolvimento e uso de IA são tópicos quentes com opiniões variadas sobre a aquisição de IA superinteligente pelo mundo.
Fazer um servidor doméstico Linux dormir em modo inactivo e acordar a pedido - a forma simples
O artigo detalha como configurar um servidor doméstico com Ubuntu Linux para dormir em modo inactivo e acordar a pedido de alojamento de cópias de segurança da Time Machine.
Wake-on-LAN activado para acordar o servidor através de pacotes unicast.
Serviços de rede, incluindo ARP Stand-in e Avahi, configurados para manter a conectividade de rede enquanto o servidor dorme.
Código partilhado para determinar o estado de inactividade/ocupação e automatizar a suspensão à RAM através de um cron job.
É necessário um dispositivo Linux separado sempre ligado e um dispositivo de interface de rede que suporte Wake-on-LAN com pacotes unicast.
O ARP Stand-in permite que um dispositivo de rede responda aos pedidos do ARP em nome de um servidor adormecido, desencadeando o seu despertar.
O autor utilizou Ruby e libpcap com um filtro para os pacotes de pedidos ARP, visando o endereço IP do servidor adormecido, para implementar o ARP Stand-in.
Problemas de despertar não desejados causados por pacotes AFP e consultas da NetBIOS abordados.
O artigo explica como desactivar o IPv6 e utilizar o espelhamento de portas para capturar pacotes de um dispositivo intermediário entre o servidor e o resto da rede.
Avahi usado pelo autor como um serviço de stand-in para a ARP.
O autor utilizou avahi-publish para configurar o Raspberry Pi.
O autor criou uma definição de serviço de sistema que corre automaticamente avahi-publish no arranque.
A configuração tem sido bem sucedida há mais de um mês.
Raspberry Pi é uma opção popular para servidores de baixa potência, mas alguns utilizadores recomendam a sua utilização para sincronização de ficheiros com um servidor de backup 'real' em vez de uma configuração 'on-demand'.
As sugestões para o funcionamento de servidores de baixa potência incluem o uso de wifi e a configuração de ethernet para o funcionamento de baixa potência.
Sugere-se a utilização de mini PCs alternativos, tais como placas NAS Beelink e Topton.
O ChatGPT é recomendado para uma resolução mais rápida de problemas.
As características de poupança de energia e as dificuldades em torno da definição de "ocioso" são discutidas.
São debatidas configurações LAN e backups auto-hospedados versus serviços em nuvem, bem como as preocupações em torno da privacidade e vigilância.
Dicas sobre como optimizar a utilização de energia são partilhadas pelos leitores, tais como rodar para baixo os discos rígidos e utilizar fontes de alimentação eficientes.
A tecnologia IPv6 e os seus benefícios são discutidos.
Estratégias para minimizar a utilização de energia pelos servidores domésticos são discutidas.
O ARP spoofing pode ser utilizado para acordar um servidor adormecido.
O posto fornece reconstruções e diagramas de vários artrópodes antigos incluindo Euarthropods, Dinocarídeos, Lobopodians, e muito mais.
O utilizador, Junnn11, é um entusiasta de artrópodes com foco no problema da cabeça do panartrópode, filogenia através da subfila do artrópode e da linhagem do caule, queliceratos basais, dinocaridos, e lobopodios.
O post inclui uma lista de várias espécies de fuxianhuiids, megacheirans, pycnogonids, sinzifosurines, chasmataspidids, eurypterids, aracnids, e muito mais.
Há também desenhos interpretativos de vários artrópodes antigos.
O post fornece links para a página japonesa da Wikipedia e para a conta do Twitter do utilizador.
Não há nenhum lançamento novo ou recente mencionado no post.
O posto no Discussion Service mostra indivíduos profundamente investidos em assuntos de nicho, incluindo tecnologia, biologia, e modelagem.
Os utilizadores discutem os benefícios e desvantagens de serem investidos em tais tópicos, incluindo o impacto na motivação e o doutoramento legitimando os interesses de cada um.
As ilustrações de User Junnn11 retratando a biomecânica e o movimento dos artrópodes numa página da Wikipedia suscitaram discussões sobre biologia, genética, e o conceito de ver.
Os utilizadores discutem também o "problema da cabeça do artrópode" e as preferências de design do utilizador, tais como imagens carregadas de preguiça.
O carregamento preguiçoso tags em páginas web por defeito é uma preocupação de privacidade e não está actualmente implementado no Safari ou no Firefox, e pode quebrar alguns websites.
A aplicação MediaWiki é uma plataforma PHP para criar conteúdo gerado pelo utilizador, e as ilustrações de insectos de Junnn11 numa página do utilizador ganharam atenção.
Y Combinator está a aceitar candidaturas para o Verão de 2023.
Peter Van Hardenberg defende o software local-first onde os programas funcionam em dispositivos e aproveitam a nuvem para "durabilidade ou acessibilidade" sem estarem dependentes dela.
O software tradicional de nível empresarial e os serviços na nuvem são como construir porta-aviões caros quando são necessárias ferramentas simples, pessoais e fáceis de manter.
Online e offline deve ser pensado como um continuum com diferentes níveis de latência.
Offline é apenas a forma mais extrema de latência e tem as suas próprias gradações de segundos, minutos, horas, dias, e muito mais.
Mudar a ideia de binários online/offline para um espectro de latência abre novas portas para a construção de coisas diferentes.
O artigo discute o conceito de aplicações offline vs. online e o debate sobre se devem ser consideradas como as mesmas ou categorias distintas com as suas próprias exigências.
A conversa mergulha no pessimismo vs. optimismo da IU e da localização dos dados vs. propriedade dos dados.
A resolução de conflitos é uma questão complexa quando se lida com aplicações e soluções off-line deve ser concebida para lidar tanto com o ambiente on-line como off-line.
É proposta uma abordagem aos produtos baseada na sincronização de dados.
As primeiras experiências offline têm de ser cuidadosamente concebidas para tratar tudo como uma fonte de verdade e lidar com esquemas e migrações de lógica empresarial.
As aplicações peer-to-peer são preferidas por alguns utilizadores a serviços baseados na Internet, devido a preocupações de privacidade e controlo.
A escolha da abordagem (local vs. baseada na nuvem) depende das necessidades e preferências do utilizador.
A discussão aborda desafios técnicos, tais como NAT e sistemas de descoberta, e discute soluções potenciais, incluindo normas federadas e redes em malha.
É mencionada a importância da tolerância offline em aplicações como Google Maps, iMessage, e aplicações meteorológicas.
A discussão centra-se na questão de saber se o offline-first é uma solução viável para ferramentas de colaboração.
Vários comentadores discutem os prós e os contras da comunicação offline vs. online e a importância de um design resistente.
A maioria das minhas capacidades não valem agora nada, mas 10% valem 1000x
ChatGPT pode fornecer respostas precisas para tarefas técnicas simples mas pode estar confiantemente errado em tarefas mais complicadas.
A qualidade das respostas do ChatGPT poderia ser melhorada através da sua formação em corpus de maior qualidade, enquanto outros advertem contra confiar demasiado na IA para aprender.
Os grandes modelos linguísticos podem carecer de materiais de origem em certas áreas, mas a capacidade de interagir com o ChatGPT e correcções pode ser útil.
O ChatGPT pode fornecer informação básica para não-peritos mas pode necessitar de validação e verificação.
Modelos geradores poderiam democratizar a escrita e ajudar a gerar mais texto, mas os cépticos acreditam que poderia levar ao analfabetismo e à eliminação de alguns trabalhos de escrita.
O texto gerado por IA poderia levar à eliminação de trabalhos de escrita de menor remuneração, mas pode não afectar a escrita de alta qualidade e de elevado salário.
Os "chatbots" de IA podem gerar código pobre, e os legisladores e juízes que adoptam o texto gerado são uma preocupação.
Os modelos linguísticos alimentados por IA melhoram a produtividade dos escritores, mas não podem substituir totalmente os bons escritores.
A escrita pode em breve tornar-se uma parte significativa do trabalho de todos, mas muitos escritores e editores podem precisar de mudar de carreira.
A tecnologia e a IA tornaram repetidamente obsoletas as velhas formas de fazer as coisas, incluindo computadores humanos em bancos e folhas de cálculo, mas não podem substituir as competências nucleares dos desenhadores gráficos.
Porque é que alguns investigadores pensam que estou errado acerca das redes sociais e das doenças mentais
Está em curso um debate entre cientistas sociais sobre se as redes sociais são a principal causa da epidemia de doenças mentais na adolescência.
Os críticos argumentam que as provas não são suficientemente fortes para apoiar as alegações de danos.
Os defensores argumentam que algo de significativo está a acontecer à saúde mental dos adolescentes que começou por volta de 2012, sem qualquer explicação alternativa.
As taxas de doença mental e o uso das redes sociais não têm uma relação clara de causa e efeito, mas os cépticos não conseguem explicar a epidemia de forma tão clara como a teoria do SSM.
Os cépticos exigem um elevado nível de cepticismo fundamentado em "para além de dúvidas razoáveis", o que é inadequado para casos civis.
Existe desacordo entre os cientistas quanto à dimensão da correlação entre o uso das redes sociais e os problemas de saúde mental.
Os meios de comunicação social podem ser particularmente prejudiciais para as raparigas.
Os investigadores concentram-se frequentemente num modelo causal quando transformam uma questão em variáveis que podem medir, o que pode obscurecer outros potenciais caminhos causais.
Dois dos modelos causais que poderiam explicar o aumento das doenças mentais na adolescência são o modelo do período sensível e o modelo da perda de IIRL.
O autor recomenda medidas tais como atrasar os smartphones até à escola secundária, ter escolas sem telefone, e aumentar a idade da "idade adulta da Internet" para os 16 anos.
O governo federal não fez nada para reduzir a utilização de smartphones por menores de idade, e há necessidade de uma discussão nacional e global sobre se os smartphones e as redes sociais interferem com o desenvolvimento saudável dos adolescentes.
Os cépticos são necessários para levantar contra-argumentos contra os alarmistas e para apontar fraquezas nas provas.
A verificação da idade dos smartphones pode ser feita através de métodos inovadores já oferecidos por empresas como a Clear.
A vigilância constante dos meios de comunicação social e a sua natureza viciante estão a causar problemas de saúde mental, falta de sono, e crescimento pessoal.
A discussão sublinha a necessidade de uma compreensão matizada dos efeitos das redes sociais na saúde mental, incluindo a depressão, o bullying, e o suicídio.
A mudança para jogos de vídeo sempre em linha que encorajam o comportamento viciante é preocupante, e alguns defendem medidas para proteger os menores de 18 anos.
Os meios de comunicação social têm afectado a vida das crianças ao limitar o seu desenvolvimento de independência, e a falta de actividade ao ar livre é um problema que precisa de ser resolvido.
A fiabilidade da auto-reportagem e dos dados a nível populacional é discutida em relação à compreensão das causas da depressão.
As provas disponíveis apoiam a alegação de que os meios de comunicação social causam problemas de saúde mental, e a direcção da causalidade é difícil de estabelecer.
O impacto das alterações climáticas na saúde mental dos jovens, a falta de activismo à sua volta, e o papel das corporações, governos e indivíduos são discutidos.
O consumo de energia e a falta de alternativas ideais aos combustíveis fósseis, bem como as más práticas parentais, são também mencionados.
ChatPDF oferece uma ferramenta para melhorar as experiências de aprendizagem dos estudantes, ajudando na compreensão de livros didácticos e documentos de investigação.
A plataforma pode analisar eficazmente uma série de documentos, incluindo relatórios financeiros e de vendas, propostas de projectos, manuais de formação e contratos jurídicos.
ChatPDF oferece armazenamento seguro em nuvem para dados confidenciais e a possibilidade de apagar a qualquer momento.
Para mentes curiosas, ChatPDF pode desbloquear uma riqueza de conhecimentos de documentos históricos, literatura, e outras fontes.
A ferramenta pode compreender qualquer língua e pode responder na língua de preferência do utilizador.
ChatPDF oferece uma API, opções de preços, FAQ, programa de afiliados e suporte via Twitter e e-mail.
ChatPDF é um novo serviço que permite aos utilizadores fazer perguntas sobre documentos PDF usando a API GPT do OpenAI para gerar respostas
As sugestões feitas para melhorar o serviço incluem o ajuste do tamanho do pedaço, a optimização da pesquisa semântica ou da recorrência para PDFs mais complexos, e o agrupamento de texto PDF
Alguns utilizadores expressam cepticismo, enquanto outros apontam benefícios tais como melhores resultados de pesquisa e indexação semântica
São sugeridas soluções alternativas auto-hospedadas para a utilização de ChatGPT para a utilização de documentos sensíveis
ChatPDF é semelhante a outros serviços de indexação semântica, com sugestões para potenciais melhorias, tais como uma versão experimental
Alguns comentadores brincam com o hype que envolve os modelos de IA GPT sugerem outros tipos de ficheiros para análise
A porta GTK+3 do GIMP está oficialmente concluída
O satélite Landsat da NASA tirou uma imagem de outro satélite, desencadeando uma discussão em torno da tecnologia e engenharia de satélites.
Os utilizadores partilharam factos interessantes sobre vários satélites, incluindo satélites de alcance laser e de inteligência.
As empresas estão a trabalhar em projectos para uma melhor imagem, enviando satélites para mais perto da Terra.
A Maxar Technologies lançou um vídeo mostrando o seu satélite WorldView-4 a tirar imagens de outro satélite em órbita, com vectores adicionais para posicionamento.
Alguns comentadores notaram as reflexões "cintilantes" causadas pelo isolamento reflectivo das naves espaciais.
O vídeo é visto como prova da crescente viabilidade comercial da imagem no espaço, apesar dos comentários negativos dos meios de comunicação social.