StableLM - это новая языковая модель с открытым исходным кодом, предназначенная для задач обработки естественного языка.
Модель уникальна тем, что позволяет пользователям обучать и настраивать ее на своих собственных наборах данных, тем самым повышая производительность при изучении языка для конкретных задач.
Архитектура модели основана на BERT и разработана таким образом, что бы минимизировать катастрофическое забывание.
Модель предварительно обучена на большом корпусе текстов, включая Википедию и Common Crawl.
Программное обеспечение просто в использовании и доступно на GitHub, а документация поможет пользователям начать работу.
StableLM уже используется в различных приложениях, включая классификацию текстов и анализ настроений.
Новая языковая модель с открытым исходным кодом под названием StableLM была выпущена компанией Stability.AI, с моделями от 3B до 65B параметров и шириной контекста 4096.
Оценка модели вызвала критику, но это хороший вариант для разработчиков, которые хотят улучшить модель, поскольку она с открытым исходным кодом.
В настоящее время тестируется альфа-модель StableLM, ожидается, что она превзойдет Pythia 6.9B и будет обучена на 1,5 триллионах лексем.
Более крупные модели обучаются быстрее, но склонны к чрезмерной подгонке, и корпорации заставл яют потребителей платить за вычислительную мощность вперед.
Оптимизированные ML-фреймворки становятся все более доступными на потребительском оборудовании, но хорошие языковые модели в настоящее время требуют дорогих графических процессоров, что делает облачные API единственным вариантом.
Обслуживание языковых моделей через API позволяет оптимизировать выводы, но локальные вычисления обеспечивают большую конфиденциальность в приложениях ИИ.
Стэнфордские исследователи выпустили StableLM под лицензией с открытым исходным кодом, что вызвало различные мнения.
Разработка и использование ИИ являются актуальными темами с различными мнениями о том, что сверхинтеллектуальный ИИ захватит мир.
Заставить домашний сервер Linux спать в режиме ожидания и просыпаться по требованию - простой способ
Статья подробно описывает, как настроить домашний сервер под управлением Ubuntu Linux на режим ожидания и пробуждения по требованию для размещения резервных копий Time Machine.
Wake-on-LAN включен для пробуждения сервера через одноадресные пакеты.
Сетевые службы, включая ARP Stand-in и Avahi, настроены для поддержания сетевого соединения, пока сервер спит.
Общий код для определения состояния простоя/занятости и автоматической приостановки работы в оперативной памяти с помощью задания cron.
Необходимо отдельное постоянно включенное устройство Linux и устройство сетевого интерфейса, поддерживающее Wake-on-LAN с одноадресными пакетами.
ARP Stand-in позволяет сетевому устройству отвечать на ARP-запросы от имени спящего се рвера, вызывая его пробуждение.
Для реализации ARP Stand-in автор использовал Ruby и libpcap с фильтром для пакетов ARP-запросов, нацеленных на IP-адрес спящего сервера.
Устранены нежелательные проблемы пробуждения, вызванные пакетами AFP и запросами NetBIOS.
Статья объясняет, как отключить IPv6 и использовать зеркалирование портов для перехвата пакетов с промежуточного устройства между сервером и остальной сетью.
Avahi используется автором в качестве замены ARP.
Автор использовал avahi-publish для настройки Raspberry Pi.
Автор создал определение службы systemd, которая автоматически запускает avahi-publish при загрузке.
Raspberry Pi - популярный вариант для серверов с низким энергопотреблением, но некоторые пользователи рекомендуют использовать его для синхронизации файлов с "настоящ им" сервером резервного копирования, а не для установки по требованию.
Предложения по работе сервера с низким энергопотреблением включают использование wifi и настройку ethernet для работы с низким энергопотреблением.
Предлагаются альтернативные мини-ПК, такие как платы Beelink и Topton NAS.
Для более быстрого устранения неполадок рекомендуется использовать ChatGPT.
Обсуждаются функции энергосбережения и сложности, связанные с определением "простоя".
Обсуждаются настройки Wake on LAN и самостоятельное резервное копирование в сравнении с облачными сервисами, а также проблемы, связанные с конфиденциальностью и наблюдением.
Читатели делятся советами о том, как оптимизировать энергопотребление, например, раскручивать жесткие диски и использовать энергосберегающие блоки питания.
Обсуждается технология IPv6 и ее преимущества.
Обсуждаются стратегии минимизации энергопотребления домашних серверов.
Подмена ARP может быть использована для пробуждения спящего сервера.
Этот пост на Discussion Service демонстрирует людей, глубоко увлеченных нишевыми темами, включая технологии, биологию и моделирование.
Пользователи обсуждают преимущества и недостатки инвестирования в такие темы, включая влияние на мотивацию и легитимацию интересов кандидата наук.
Иллюстрации пользователя Junnn11, изображающие биомеханику и движение членистоногих на странице Википедии, вызвали дискуссию о биологии, генетике и концепции видения.
Пользователи также обсуждают "проблему головы членистоногого" и предпочтения пользовательского дизайна, такие как лениво загружаемые изображения.
Ленивая загрузка тегов на веб-страницах по умолчанию является проблемой конфиденциальности и в настоящее время не реализована в Safari или Firefox, а также может нарушить работу некоторых веб-сайтов.
Приложение MediaWiki - это PHP-платформа для создания пользовательского контента, и иллюстрации насекомых на странице пользо вателя Junnn11 привлекли внимание.
Y Combinator принимает заявки на лето 2023 года.
Оффлайн - это просто онлайн с экстремальной задержкой
Питер Ван Харденберг выступает за локально-первое программное обеспечение, где программы работают на устройствах и используют облако для "долговечности или доступности", не будучи зависимыми от него.
Традиционное программное обеспечение корпоративного уровня и облачные сервисы подобны строительству дорогостоящих авианосцев, когда необходимы простые, персональные и легкие в обслуживании инструменты.
Онлайн и офлайн следует рассматривать как континуум с различными уровнями задержки.
Оффлайн - это лишь самая крайняя форма задержки, которая имеет свои градации: секунды, минуты, часы, дни и т.д.
Перенос представления о бинарах онлайн/оффлайн на спектр задержек открывает новые возможности для создания различных вещей.
В статье обсуждается концепция автономных и онлайновых приложений и дебаты о том, следует ли рассматривать их как одно и то же или как разные категории со своими требованиями.
Разговор заходит о пессимистичном и оптимистичном пользовательском интерфейсе и о локальности данных и владении данными.
Разрешение конфликтов - сложный вопрос при работе с автономными приложениями, и решения должны быть разработаны для работы как в онлайн, так и в офлайн среде.
Предлагается переход к продуктам на основе синхронизации данных.
Оффлайн-приложени я должны быть тщательно продуманы, чтобы все данные рассматривались как источник истины, а также для переноса схем и бизнес-логики.
Некоторые пользователи предпочитают одноранговые приложения, а не интернет-сервисы из-за соображений конфиденциальности и контроля.
Выбор подхода (локальный или облачный) зависит от потребностей и предпочтений пользователя.
Обсуждение затрагивает технические проблемы, такие как NAT и системы обнаружения, и обсуждает потенциальные решения, включая федеративные стандарты и ячеистые сети.
Упоминается важность автономного доступа в таких приложениях, как Google Maps, iMessage и погодные приложения.
Дискуссия ведется вокруг вопроса о том, является ли автономный режим жизнеспособным решением для инструментов совместной работы.
Различные комментаторы обсуждают плюсы и минусы автономного и онлайн-общения, а также важность устойчивой конструкции.
Большинство моих навыков сейчас ничего не стоят, но 10% стоят в 1000 раз больше.
ChatGPT может дать точные ответы на простые технические задачи, но может уверенно ошибаться при решении более сложных задач.
Качество ответов ChatGPT может быть улучшено за счет обучения на более качественном корпусе, в то время как другие предостерегают от того, чтобы слишком сильно полагаться на ИИ в обучении.
Большим языковым моделям может не хватать исходных материалов в некоторых областях, но возможность взаимодействия с ChatGPT и исправления могут быть полезны.
ChatGPT может предоставить базовую информацию для неспециалистов, но может нуждаться в валидации и проверке.
Генеративные модели могут демократизировать письменность и помочь генерировать больше текста, но скептики считают, что это м ожет привести к неграмотности и ликвидации некоторых писательских профессий.
Генерируемый ИИ текст может привести к ликвидации низкооплачиваемых писательских профессий, но не повлиять на высокооплачиваемые и высококачественные письменные работы.
Чат-боты с ИИ могут генерировать некачественный код, а законодатели и судьи, принимающие генерируемый текст, вызывают беспокойство.
Языковые модели на базе ИИ повышают производительность труда писателей, но не могут полностью заменить хороших писателей.
Возможно, скоро написание текстов станет важной частью работы каждого человека, но многим писателям и редакторам, возможно, придется сменить профессию.
Технологии и ИИ неоднократно делали устаревшими старые способы ведения дел, включая человеческие компьютеры в банках и электронных таблицах, но они не могут заменить основные компетенции графических дизайнеров.
Почему некоторые исследователи считают, что я ошибаюсь насчет социальных сет ей и психических заболеваний
Среди социологов продолжается спор о том, являются ли социальные медиа основной причиной эпидемии психических заболеваний среди подростков.
Критики утверждают, что доказательства недостаточно убедительны, чтобы поддержать утверждения о вреде.
Сторонники утверждают, что с психическим здоровьем подростков происходит нечто значительное, начавшееся примерно в 2012 году, и альтернативных объяснений этому нет.
Показатели психических заболеваний и использования соц иальных сетей не имеют четкой причинно-следственной связи, но скептики не могут объяснить эпидемию так же четко, как теория SSM.
Скептики требуют высокого уровня скептицизма, основанного на принципе "вне разумных сомнений", что неуместно в гражданских делах.
Между учеными существуют разногласия по поводу размера корреляции между использованием социальных сетей и проблемами психического здоровья.
Социальные медиа могут быть особенно вредны для девочек.
Исследователи часто фокусируются на одной причинно-следственной модели, когда превращают вопрос в переменные, которые они могут измерить, что может заслонить другие потенциальные причинно-следственные пути.
Две причинные модели, которые могут объяснить рост психических заболеваний среди подростков, - это модель чувствительного периода и модель утраты ВРС.
Автор рекомендует такие меры, как отсрочка использования смартфонов до старшей школы, школы без телефонов и повышение возраста "интернет-взрослости" до 16 лет.
Федеральное правительство не сделало ничего, чтобы уменьшить использование смартфонов несовершеннолетними, поэтому необходимо провести национальную и глобальную дискуссию о том, мешают ли смартфоны и социальные сети здоровому развитию подростков.
Скептики нужны, чтобы выдвигать контраргументы против тревожных звонков и указывать на слабые места в доказательствах.
Проверка возраста для смартфонов может быть осуществлена с помощью инновационных методов, уже предлагаемых такими компаниями, как Clear.
Постоянное наблюдение со стороны сверстников и привыкание к социальным медиа вызывают проблемы с психическим здоровьем, недосыпание и личностный рост.
Обсуждение подчеркивает необходимость тонкого понимания влияния социальных сетей на психическое здоровье, включая депрессию, издевательства и самоубийства.
Сдвиг в сторону видеоигр, которые всегда онлайн и способствуют развитию аддиктивного поведения, вызывает озабоченность, и некоторые выступают за принятие мер по защите людей младше 18 лет.
Социальные медиа влияют на жизнь детей, ограничивая развитие их независимости, а недостаток активности на свежем воздухе - проблема, требующая решения.
Надежность самоотчетов и данных на уровне населения обсуждается в связи с пониманием причин депрессии.
Имеющиеся данные подтверждают утверждение о том, что социальные медиа вызывают проблемы с психическим здоровьем, однако направление причинно-следственной связи установить сложно.
Обсуждается влияние изменения климата на психическое здоровье молодых людей, отсутствие активизма вокруг него, а также роль корпораций, правительств и отдельных людей.
Также упоминается потребление энергии и отсутствие идеальных альтернатив ископаемому топливу, а также плохая практика воспитания детей.