Gemini 3 Pro от Google лидирует в новом тесте надежности ИИ, но сохраняет высокий уровень галлюцинаций — 88%. Исследование показывает, что большие модели точнее, но не надежнее.
OpenAI выпустила GPT-5.1-Codex-Max — модель для программирования, способную работать над задачами до 24 часов с улучшенной эффективностью и поддержкой Windows.
Function Health привлекла $298 млн для разработки медицинского ИИ, который будет давать персонализированные рекомендации на основе лабораторных анализов и данных пользователей.
ServiceNow AI ускорила языковую модель рассуждений в 2,1 раза через дистилляцию на специальных данных, сохранив качество логических цепочек.
SQaLe — крупнейший датасет для обучения моделей преобразования естественного языка в SQL с 135 тысячами схем баз данных и 500 тысячами проверенных примеров.
Исследование показывает, что фильтрация данных в био-моделях не обеспечивает полной защиты. Опасные знания сохраняются в скрытых слоях и могут быть восстановлены с помощью простых техник.
Manus интегрирует своего персонального ИИ-ассистента в Microsoft Agent 365, становясь одним из первых партнеров платформы управления ИИ-агентами с корпоративной безопасностью.
Музыкальный ИИ-стартап Suno привлек 125 млн долларов для развития технологий генерации музыки. Платформа уже создала более 10 миллионов треков и продолжает быстро расти.
Исследование MIT показывает, что модели ИИ с функциями рассуждения тратят на решение сложных задач пропорционально столько же вычислительных ресурсов, сколько времени требуется людям.
Китайские ученые разработали метод квантового сжатия ИИ-моделей, уменьшив DeepSeek-R1 в 10 раз с сохранением 97% производительности.