Языковая модель GPT-4 от OpenAI правильно ответила на 85% вопросов теста Американского совета психиатрии и неврологии — средний человеческий показатель составляет 73,8%, а ChatGPT-3.5 не ошибся только в 66,8% вопросов.
Исследователи использовали банк вопросов для экзамена по неврологии Американского совета психиатрии и неврологии с небольшой группой вопросов от Европейского совета по неврологии.
Авторы исследования полагают, что после некоторой доработки ChatGPT может найти практическое применение в клинической неврологии.