Блог

Статьи об AI-автоматизации, речевой аналитике и интеллектуальных агентах для бизнеса

Cover Image for Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам

Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам

Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.

Cover Image for Verbatim RAG: метод извлечения текста для полного устранения галлюцинаций в RAG-системах

Verbatim RAG: метод извлечения текста для полного устранения галлюцинаций в RAG-системах

Verbatim RAG устраняет галлюцинации в RAG-системах, заставляя модели извлекать точные фрагменты текста вместо генерации ответов.

Cover Image for Оптимизатор Muon показал лучшие результаты при тонкой настройке языковых моделей

Оптимизатор Muon показал лучшие результаты при тонкой настройке языковых моделей

Гибридный оптимизатор Muon+AdamW показал лучшие результаты при тонкой настройке языковых моделей, превзойдя как чистый Muon, так и AdamW в экспериментах с Qwen3 4B.

Cover Image for RAG для потоковых данных: новый подход к работе с динамической информацией

RAG для потоковых данных: новый подход к работе с динамической информацией

Новый подход к RAG-архитектуре позволяет работать с потоковыми данными в реальном времени, решая проблему задержек традиционных систем при обработке динамической информации.

Cover Image for Amazon представляет Nova Lite 2.0 — систему рассуждений для сложных сценариев техподдержки

Amazon представляет Nova Lite 2.0 — систему рассуждений для сложных сценариев техподдержки

Amazon представила Nova Lite 2.0 — систему искусственного интеллекта для поддержки клиентов, которая использует архитектуру, основанную на рассуждениях, для решения сложных, многошаговых запросов.

Cover Image for Waymo раскрывает архитектуру безопасного ИИ для беспилотных автомобилей

Waymo раскрывает архитектуру безопасного ИИ для беспилотных автомобилей

Waymo раскрывает архитектуру своего ИИ для беспилотных автомобилей, основанную на принципе доказуемой безопасности и достигшей 100 миллионов миль автономного движения.

Cover Image for Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает

Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает

Исследование показало снижение прозрачности в индустрии ИИ: средний балл компаний упал до 40 из 100. IBM лидирует с 95 баллами, xAI и Midjourney — аутсайдеры с 14 баллами.

Cover Image for Исследование сотен миллионов чатов показало, что ИИ-агентов чаще используют для сложных задач

Исследование сотен миллионов чатов показало, что ИИ-агентов чаще используют для сложных задач

Первое масштабное исследование использования AI-агентов показало, что 57% активности приходится на когнитивную работу, а не рутинные задачи.

Cover Image for Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы

Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы

Jais 2 — семейство арабских языковых моделей от G42 и Cerebras, работающих со скоростью 2000 токенов/с и устанавливающих новые стандарты культурного соответствия.

Cover Image for Mistral выпустила Devstral 2 — мощную модель для программистов с ограниченной лицензией

Mistral выпустила Devstral 2 — мощную модель для программистов с ограниченной лицензией

Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.