Открытие гетерогенных особенностей в механизме внимания RoPE-моделей: разные измерения отвечают за различные аспекты обработки длинного контекста.
Глава Alphabet Сандар Пичаи предупредил о перегреве рынка ИИ и признал элементы иррациональности в текущем инвестиционном буме, сравнив ситуацию с дотком-пузырем.
AWS Professional Services представила систему агентного ИИ, которая сокращает сроки корпоративных проектов с месяцев до недель. Новые ИИ-агенты автоматизируют технические задачи, позволяя консультантам сосредоточиться на стратегии.
OpenAI разрешила сотрудникам передавать акции благотворительным организациям после многолетнего давления, но программа имеет ограничения по срокам и условиям участия.
Microsoft Research представила метод GAD для эффективного сжатия больших языковых моделей, позволяющий малым моделям достигать качества GPT-5 без доступа к внутренним параметрам.
Новый бенчмарк AA-Omniscience оценивает способность языковых моделей отличать факты от вымысла. Модели Anthropic показали самые низкие показатели галлюцинаций.
Исследование показало, что более 56% ссылок, генерируемых ChatGPT для научных работ, либо полностью выдуманы, либо содержат серьезные ошибки, что ставит под угрозу достоверность исследований.
Стартапы создают компактные ИИ-модели с меньшим числом параметров, которые превосходят гигантов в специализированных задачах при значительно меньших затратах.
ElevenLabs расширяет свою платформу, добавляя инструменты для создания изображений и видео с ИИ. Новая функция объединяет ведущие модели визуального контента с голосовыми технологиями компании.
Норвежский дата-центр Nscale в Гломфьорде демонстрирует новый подход к экологичной ИИ-инфраструктуре с PUE 1.1 и утилизацией 85% тепла для аквакультуры.