연구: AI는 사례 진단에서 의사보다 뛰어난 성능을 발휘할 수 있습니다.

목요일에 발표된 연구 결과에 따르면, “추론”할 수 있는 인공 지능은 이제 의사와 같거나 그보다 더 나은 실제 의료 시나리오를 진단할 수 있습니다. 과학.

연구원들은 이전에 알려지지 않은 임상 사례를 사용하여 OpenAI의 추론 모델 o1을 회사의 이전 모델인 GPT-4와 교육 중인 의사 및 레지던트에 대해 테스트했습니다.

다양한 실험에서 o1 모델은 종종 GPT-4의 진단 능력과 최고의 의사에서도 크게 향상되었습니다. 보스턴 병원의 무작위 응급실 사례에 대한 전자 건강 기록으로 테스트했을 때 o1 모델은 초기 분류 시점의 2/3 이상 진단적으로 정확했습니다. 두 명의 전문 주치의가 대략 절반의 시간 동안 정확한 진단을 했습니다.

다음도 참조하세요:

AI가 혈액 검사에 대해 알려줄 수 있는 것

샌프란시스코 캘리포니아 대학교 의과대학 교수 겸 학과장인 로버트 워치터(Robert Wachter) 박사는 이번 연구 결과가 “중요하다”고 설명했으며, 올바른 진단과 다음 단계를 식별하라는 요청을 받았을 때 현대 AI가 기존의 대형 언어 모델과 의사보다 뛰어난 성능을 발휘할 것이라는 점은 이제 “분명히”라고 제안했습니다. 그는 연구에 참여하지 않았습니다.

그러나 “의 저자인 와터(Wachter)는거대한 도약: AI가 헬스케어를 어떻게 변화시키고 있는지, 그리고 그것이 우리의 미래에 어떤 의미를 갖는지”라며 AI가 임상에 완전히 구현되기 위해서는 더 많은 연구가 필요하다고 덧붙였다.

“문제는 이것이 실제 생활과 얼마나 밀접하게 복제되는지입니다. 대답은 적당히 괜찮지만 완벽하지는 않습니다.”라고 Wachter는 이메일에 썼습니다.

연구의 저자가 인정한 바와 같이, 실험은 텍스트 입력에만 국한되었으며 의사가 진단을 위해 자주 의존하는 시각 및 청각 단서와 단서는 포함되지 않았습니다. 여기에는 환자의 고통 수준과 의료 영상이 포함될 수 있습니다.

“GenAI는 아마도 이러한 입력을 통합하기 시작할 수 있지만 현재로서는 서면으로 작성되고 종종 인위적으로 ‘깨끗한’ 임상 사례 시나리오를 테스트하는 것은 응급실에 가서 혼란을 처리하는 것과는 다릅니다.”라고 Wachter는 말했습니다. “그냥 지켜봐 더 피트.”

다음도 참조하세요:

‘더 피트’ 시즌 3은 언제 나오나요?

연구 결과를 바탕으로 연구 저자들은 AI 시스템이 어떻게 임상 실습과 환자 결과를 개선할 수 있는지 결정하기 위한 추가 연구와 전향적 임상 시험이 “시급하게” 필요하다는 점을 강조했습니다.

“LLM의 급속한 개선 속도는 임상 의학의 과학 및 실습에 상당한 영향을 미칩니다.”라고 저자 중 다수는 연구가 수행된 보스턴의 Beth Israel Deaconess Medical Center에 기반을 두고 있습니다.

다음에도 게재된 첨부 기사 과학 이 연구에 참여하지 않은 호주 애들레이드에 있는 플린더스 건강 및 의학 연구소의 전문가 두 명이 작성한 이 글은 그 긴급한 의미에 동의했습니다. 그들은 또한 의사를 AI로 대체하는 것에 반대하고 대신 감독, 상황에 따른 판단 및 책임을 제공하는 협업 스타일을 구상한다고 주장했습니다.

전문가들은 “강력하게 입증된 효과성, 형평성, 안전성이 없다면 많은 AI 시스템은 임상 용도로 사용하기에 불충분할 것”이라고 썼습니다.

자세한 정보 확인

자세한 정보 확인

관련 기사

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다