Ученые разработали новый бенчмарк: оказалось, что ИИ не знает высшую математику