Новые результаты бенчмарка Gaia2: почему важно явное мышление для ИИ-агентов