Mars Financeのニュース 4月15日付け、アメリカのハーバード医科大学の研究チームは、最先端のAI大規模言語モデル(LLM)20種類以上の診断能力を評価しました。その中にはChatGPT、DeepSeek、Gemini、Claudeも含まれます。結果は、患者の初期症状や兆候に基づいて「鑑別診断」(潜在的な疾患の識別)を行う誤り率が最大80%に達することを示しました。この研究はさらに、患者がより多くの検査結果を提供した場合、大規模モデルは「最終診断」の失敗率を約40%にまで下げることができることを明らかにしました。研究者は、これがAIチャットボットがより正確な診断を下すためには、十分な患者情報を必要とすることを意味していると述べています。患者が完全な健康検査情報を提供できない場合、AIの提供する結果は信頼できないということです。研究者はまた、「人工知能は、医療専門家の介入なしに患者の診断決定を行うレベルには達していない」と強調しました。(第一财经)
ハーバードの最新研究:AIの大規模言語モデルを使った診断は、80%の初期診断が誤っている
Mars Financeのニュース 4月15日付け、アメリカのハーバード医科大学の研究チームは、最先端のAI大規模言語モデル(LLM)20種類以上の診断能力を評価しました。その中にはChatGPT、DeepSeek、Gemini、Claudeも含まれます。結果は、患者の初期症状や兆候に基づいて「鑑別診断」(潜在的な疾患の識別)を行う誤り率が最大80%に達することを示しました。この研究はさらに、患者がより多くの検査結果を提供した場合、大規模モデルは「最終診断」の失敗率を約40%にまで下げることができることを明らかにしました。研究者は、これがAIチャットボットがより正確な診断を下すためには、十分な患者情報を必要とすることを意味していると述べています。患者が完全な健康検査情報を提供できない場合、AIの提供する結果は信頼できないということです。研究者はまた、「人工知能は、医療専門家の介入なしに患者の診断決定を行うレベルには達していない」と強調しました。(第一财经)