Обзор обновленного Open ASR Leaderboard с новыми треками для мультиязычных моделей и транскрипции длинных аудио. Анализ 60+ моделей показывает компромиссы между точностью, скоростью и языковой поддержкой.
Оптимизация модели синтеза речи NeuTTS-air позволила достичь ускорения в 211 раз относительно реального времени на одной видеокарте RTX 4070 Ti Super.
Метод Delerp позволяет создавать более эффективные языковые модели путем слияния предварительно обученных моделей без дорогостоящего дообучения, открывая новые возможности для кастомизации.
Hugging Face TRL интегрировался с RapidFire AI, позволяя запускать параллельную тонкую настройку языковых моделей с ускорением до 20 раз через адаптивное чанковое планирование.
Google расширяет возможности Gemini CLI добавлением поддержки расширений Looker, что открывает новые горизонты для разработчиков бизнес-аналитики и интеграторов.
Агентный ИИ меняет подход к цифровой устойчивости предприятий. Для эффективной работы автономных систем требуется переосмысление архитектуры данных и интеграция машинных данных.
Perplexity выпустила мобильную версию своего AI-браузера Comet для Android с встроенным ассистентом, блокировщиком рекламы и голосовым управлением.
Стартап Lightfield бросил успешное приложение для презентаций с 20 млн пользователей, чтобы создать CRM на базе ИИ, которая автоматически отслеживает клиентские взаимодействия без ручного ввода данных.
ScaleOps представила продукт для оптимизации GPU-инфраструктуры в корпоративных AI-развертываниях. Решение сокращает затраты на GPU на 50-70% и повышает эффективность использования ресурсов.
Allen Institute for AI выпустил OLMo 3 — первую полностью открытую модель мышления с прозрачной логикой рассуждений и в 2,5 раза более эффективную, чем аналоги.