
Gemini 3 Pro от Google лидирует в новом тесте надежности ИИ, но сохраняет высокий уровень галлюцинаций — 88%. Исследование показывает, что большие модели точнее, но не надежнее.

OpenAI выпустила GPT-5.1-Codex-Max — модель для программирования, способную работать над задачами до 24 часов с улучшенной эффективностью и поддержкой Windows.

Function Health привлекла $298 млн для разработки медицинского ИИ, который будет давать персонализированные рекомендации на основе лабораторных анализов и данных пользователей.

ServiceNow AI ускорила языковую модель рассуждений в 2,1 раза через дистилляцию на специальных данных, сохранив качество логических цепочек.

SQaLe — крупнейший датасет для обучения моделей преобразования естественного языка в SQL с 135 тысячами схем баз данных и 500 тысячами проверенных примеров.

Исследование показывает, что фильтрация данных в био-моделях не обеспечивает полной защиты. Опасные знания сохраняются в скрытых слоях и могут быть восстановлены с помощью простых техник.

Manus интегрирует своего персонального ИИ-ассистента в Microsoft Agent 365, становясь одним из первых партнеров платформы управления ИИ-агентами с корпоративной безопасностью.

Музыкальный ИИ-стартап Suno привлек 125 млн долларов для развития технологий генерации музыки. Платформа уже создала более 10 миллионов треков и продолжает быстро расти.

Исследование MIT показывает, что модели ИИ с функциями рассуждения тратят на решение сложных задач пропорционально столько же вычислительных ресурсов, сколько времени требуется людям.

Китайские ученые разработали метод квантового сжатия ИИ-моделей, уменьшив DeepSeek-R1 в 10 раз с сохранением 97% производительности.