Блог

Статьи об AI-автоматизации, речевой аналитике и интеллектуальных агентах для бизнеса

Dec 12, 2025

Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам

Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.

Dec 10, 2025

Verbatim RAG: метод извлечения текста для полного устранения галлюцинаций в RAG-системах

Verbatim RAG устраняет галлюцинации в RAG-системах, заставляя модели извлекать точные фрагменты текста вместо генерации ответов.

Dec 10, 2025

Оптимизатор Muon показал лучшие результаты при тонкой настройке языковых моделей

Гибридный оптимизатор Muon+AdamW показал лучшие результаты при тонкой настройке языковых моделей, превзойдя как чистый Muon, так и AdamW в экспериментах с Qwen3 4B.

Dec 10, 2025

RAG для потоковых данных: новый подход к работе с динамической информацией

Новый подход к RAG-архитектуре позволяет работать с потоковыми данными в реальном времени, решая проблему задержек традиционных систем при обработке динамической информации.

Dec 10, 2025

Amazon представляет Nova Lite 2.0 — систему рассуждений для сложных сценариев техподдержки

Amazon представила Nova Lite 2.0 — систему искусственного интеллекта для поддержки клиентов, которая использует архитектуру, основанную на рассуждениях, для решения сложных, многошаговых запросов.

Dec 10, 2025

Waymo раскрывает архитектуру безопасного ИИ для беспилотных автомобилей

Waymo раскрывает архитектуру своего ИИ для беспилотных автомобилей, основанную на принципе доказуемой безопасности и достигшей 100 миллионов миль автономного движения.

Dec 10, 2025

Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает

Исследование показало снижение прозрачности в индустрии ИИ: средний балл компаний упал до 40 из 100. IBM лидирует с 95 баллами, xAI и Midjourney — аутсайдеры с 14 баллами.

Dec 10, 2025

Исследование сотен миллионов чатов показало, что ИИ-агентов чаще используют для сложных задач

Первое масштабное исследование использования AI-агентов показало, что 57% активности приходится на когнитивную работу, а не рутинные задачи.

Dec 10, 2025

Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы

Jais 2 — семейство арабских языковых моделей от G42 и Cerebras, работающих со скоростью 2000 токенов/с и устанавливающих новые стандарты культурного соответствия.

Dec 10, 2025

Mistral выпустила Devstral 2 — мощную модель для программистов с ограниченной лицензией

Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.