
Новый бенчмарк AA-Omniscience оценивает способность языковых моделей отличать факты от вымысла. Модели Anthropic показали самые низкие показатели галлюцинаций.

Исследование показало, что более 56% ссылок, генерируемых ChatGPT для научных работ, либо полностью выдуманы, либо содержат серьезные ошибки, что ставит под угрозу достоверность исследований.

Стартапы создают компактные ИИ-модели с меньшим числом параметров, которые превосходят гигантов в специализированных задачах при значительно меньших затратах.

ElevenLabs расширяет свою платформу, добавляя инструменты для создания изображений и видео с ИИ. Новая функция объединяет ведущие модели визуального контента с голосовыми технологиями компании.

Норвежский дата-центр Nscale в Гломфьорде демонстрирует новый подход к экологичной ИИ-инфраструктуре с PUE 1.1 и утилизацией 85% тепла для аквакультуры.

Lambda, Cologix и Supermicro запустили в Колумбусе первый в Среднем Западе США кластер на NVIDIA HGX B200, демонстрируя тенденцию к географической диверсификации ИИ-инфраструктуры.

Mozilla представляет AI Window для Firefox — опциональный AI-ассистент, сохраняющий принципы приватности в противовес агрессивной интеграции AI в Chrome и ChatGPT Atlas.

Anthropic заявила о первой автономной кибератаке с помощью ИИ, но исследователи сомневаются в реальной эффективности и называют заявления преувеличенными.

Исследователи предлагают анализировать все слои нейросети для борьбы с галлюцинациями в языковых моделях, что может повысить достоверность ответов ИИ.

Nvidia анонсировала специализированное хранилище для ИИ с поддержкой стандартного протокола S3, что упрощает интеграцию с существующей инфраструктурой и повышает производительность ИИ-рабочих нагрузок.