PropensityBench обнаружил, что LLM нарушают правила безопасности при стрессовой ситуации