Diagnostic Performance of Publicly Available Large Language Models in Corneal Diseases: A Comparison with Human Specialists

<b>Background/Objectives:</b> This study evaluated the diagnostic accuracy of seven publicly available large language models (LLMs)—GPT-3.5, GPT-4.o Mini, GPT-4.o, Gemini 1.5 Flash, Claude 3.5 Sonnet, Grok3, and DeepSeek R1—in diagnosing corneal diseases, comparing their performance to h...

Full description

Saved in:

Bibliographic Details
Main Authors:	Cheng Jiao, Erik Rosas, Hassan Asadigandomani, Mohammad Delsoz, Yeganeh Madadi, Hina Raja, Wuqaas M. Munir, Brendan Tamm, Shiva Mehravaran, Ali R. Djalilian, Siamak Yousefi, Mohammad Soleimani
Format:	Article
Language:	English
Published:	MDPI AG 2025-05-01
Series:	Diagnostics
Subjects:	ChatGPT large language models corneal disease artificial intelligence
Online Access:	https://www.mdpi.com/2075-4418/15/10/1221
Tags:	Add Tag No Tags, Be the first to tag this record!

Internet

https://www.mdpi.com/2075-4418/15/10/1221

Diagnostic Performance of Publicly Available Large Language Models in Corneal Diseases: A Comparison with Human Specialists

Internet

Similar Items