NVIDIA представила ProfBench — специализированный эталон для оценки языковых моделей на профессиональных задачах уровня PhD и MBA с фокусом на анализ, рассуждение и стиль изложения.
NVIDIA выпустила новые версии Cosmos Predict 2.5 и Transfer 2.5 — моделей для генерации и трансформации виртуальных миров, предназначенных для робототехники и автономных систем.
Hugging Face разработала систему голосового согласия для клонирования голосов, требующую явного вербального подтверждения пользователя перед созданием синтетического голоса.
IBM выпустила сверхкомпактные языковые модели Granite 4.0 Nano с 350 млн и 1,5 млрд параметрами для edge-устройств с открытой лицензией Apache 2.0.
Google Cloud запускает интеграцию Oracle Database с облачной платформой для автоматизации бизнес-процессов с использованием ИИ, упрощая миграцию данных и создание ML-моделей.
Google Cloud запустила аппаратные ускорения A4X Max для тренировки ИИ-моделей в Vertex AI, что усиливает конкуренцию в облачном машинном обучении.
Google представляет фреймворк безопасности для защиты от автономных ИИ-агентов в интернете, включая идентификацию агентов, анализ поведения и новые ИИ-устойчивые методы защиты.
Scale AI и Корейский институт безопасности ИИ объявили о стратегическом партнерстве для разработки глобальных стандартов оценки и регулирования искусственного интеллекта.
Эксперты по безопасности ИИ предупреждают: традиционные методы кибербезопасности неэффективны против поведенческих угроз искусственного интеллекта. Необходим новый подход к красному тестированию моделей.
Collinear Simulations и Together AI представили совместное решение для тестирования AI-агентов в реалистичных условиях с использованием динамических симуляций пользовательского поведения.