Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам