혈액을 채취하는 것과 결과를 받는 것 사이의 막다른 골목은 환자에게 스트레스를 줄 수 있습니다. 그런 다음 의사가 이를 검토하고 결과를 번역하기 전에 전문 용어로 가득 찬 혈액 검사 보고서가 도착합니다. 경고할 이유가 없다고 판단되면 후속 조치를 취하지 않을 수도 있습니다.
인공지능 기반 챗봇을 만나보세요. ChatGPT, Claude 및 Gemini와 같은 주요 대규모 언어 모델이 몇 년 전에 데뷔한 이후 점점 더 많은 환자들이 자신의 실험실 결과를 공유하거나 자신이 선택한 챗봇에 업로드하여 지침을 구했습니다.
건강 관련 질문에 AI를 사용하시나요? 가장 정확한 답변을 위한 4가지 팁은 다음과 같습니다.
웰니스 및 라이프스타일 브랜드인 Whoop과 Levels를 포함한 기업들은 이러한 정보 격차에서 기회를 보고 AI를 통해 컨시어지 수준의 소비자 실험실 작업에 대한 관심을 이끌어낸다는 설득력 있는 주장을 내놓았습니다.
일반적으로 AI 제품은 접근 가능한 언어로 작성된 설명 보고서로, 식습관 변화, 생활 방식 수정, 의사와의 상담 등 다음 단계가 포함된 개인화된 계획을 제공합니다. 일반적으로 구독을 통해 제공되는 이 서비스는 연간 비용이 수백 달러 이상일 수 있습니다.
미국 의학 협회(American Medical Association)의 CEO인 Dr. John Whyte는 특히 환자들이 결과가 혼란스럽다고 생각할 때 그 매력을 이해합니다.
Whyte는 “의사가 (항상 그런 것은 아니지만) 최고의 의사소통자입니다.”라고 말합니다. “나는 우리가 그랬으면 좋겠고, (우리가) 더 많은 시간을 가졌으면 좋겠다.”
그러나 그는 AI가 혈액 결과를 효과적이고 정확하게 해석하고 개인의 건강을 개선하거나 최적화하기 위해 개인화된 생활 방식을 권장할 수 있다는 것을 입증하는 엄격한 연구나 증거가 없다고 말합니다. 즉, 혈액검사 AI 해석을 제공하는 기업들은 자사 제품이 단순히 무료로 챗봇을 상담하는 것보다 나은지, 의사의 소견보다 더 정확한지 아직 알지 못한다.
“일부 주장에 대해서는 회의적이어야 한다고 생각합니다”라고 Whyte는 말합니다.
__________________________________________________________________________________________
새로운 Mashable 시리즈인 AI + Health에서는 인공 지능이 의료 및 건강 환경을 어떻게 변화시키고 있는지 살펴봅니다. 귀하의 건강 데이터를 안전하게 유지하는 방법을 살펴보겠습니다.건강 관련 질문에 대해 효과적으로 챗봇을 유도하고 두 명의 여성이 AI를 사용하여 위험한 형태의 심장병을 감지하는 방법을 알아보세요.그리고 훨씬 더.
__________________________________________________________________________________________
혈액검사 결과를 알려주는 AI는 아직 갈 길이 멀다.
제조사인 Google과 OpenAI에 따르면 혈액 해석 작업을 수행하는 회사에서 사용하는 Gemini 및 ChatGPT를 포함한 AI 모델은 이러한 목적으로 검증되거나 벤치마킹되지 않았습니다.
Google은 최근 Quest Diagnostics와 제휴하여 전국적인 실험실 작업 회사의 고객에게 AI 도구를 제공하면서 의학 용어를 설명하고 개인 데이터의 추세를 파악하며 의사에게 물어볼 질문을 제안하는 데 중점을 두었습니다. 의학적 지침이나 생활 방식에 대한 조언을 제공하지 않습니다.
회사 대변인은 Google이 Gemini의 의료 벤치마크에 대한 연구를 자주 발표하는 반면 Quest 파트너십은 “환자의 실제 읽기 및 데이터 탐색 문제를 해결”하기 위해 설계되었다고 말했습니다.
회사 대변인에 따르면, 현실적인 건강 시나리오에서 모델이 얼마나 잘 작동하는지 테스트하는 OpenAI의 HealthBench에는 혈액 결과를 이해하는 예가 포함되어 있습니다. 그러나 OpenAI에는 혈액 검사에 대한 독립형 벤치마크가 없습니다.
BloodGPT 회사의 공동 창립자이자 CEO인 Jonathan Kron은 대규모 혈액 검사를 포괄적으로 해석하기 위해 널리 인정되는 벤치마크가 없다는 점을 쉽게 인정합니다.
BloodGPT는 2024년 초기 테스트에서 전체 연구 보고서를 Claude 및 ChatGPT와 같은 범용 챗봇에 직접 업로드하면 지속적으로 오류가 발생한다는 사실을 발견했습니다. 바이오마커가 완전히 누락되었거나 서로 혼동되었습니다. 때때로 챗봇은 추천을 환각적으로 표현하기도 했습니다.
이러한 경험으로 인해 BloodGPT는 결과를 검증하기 위한 여러 검사를 통해 “구조화된 파이프라인”을 구축하게 되었습니다. BloodGPT는 진화하는 강점을 기반으로 대규모 언어 모델을 교체할 수 있지만 회사는 현재 분류, 추론, 해석 및 일관성 확인을 포함한 다양한 작업에 엔터프라이즈 Gemini, OpenAI 및 Anthropic 모델을 사용하고 있습니다. 또한 생식 호르몬인 에스트로겐 및 테스토스테론과 같은 특정 바이오마커에 대한 전문가와 상담하여 AI의 정확성과 통찰력을 확인합니다.
매싱 가능한 추세 보고서
BloodGPT는 임상 실험실, 의료 시스템, LabCorp와 같은 건강 진단 회사를 포함한 다른 회사에 소프트웨어를 판매하는 주요 사업을 고려하지만 개별 소비자에게 AI 해석을 제공합니다. 소비자 요금제는 월 9.99달러에서 17.99달러까지 다양합니다.
회사는 자사의 알고리즘이 확립된 임상 지침과 검증된 의료 참조 데이터를 기반으로 하며 임상의에 의해 반복적으로 테스트된다고 밝혔습니다. BloodGPT는 아직 해당 방법의 성공을 입증하는 동료 검토 연구를 발표하지 않았습니다.
Kron은 회사가 이스라엘 의료 시스템과의 파트너십을 통해 100,000명의 식별되지 않은 환자 기록을 사용하는 대규모 연구 프로젝트에 착수할 것이라고 말했습니다. 목표는 환자의 의료 기록에 포함된 결과에 대해 다양한 방법으로 BloodGPT의 정확성을 벤치마킹하는 것입니다.
“우리는 여기서 쉬운 길을 선택하지 않습니다”라고 Kron은 말합니다.
ChatGPT Health를 사용하기 전에 이 내용을 읽어보세요.
모델 정확도가 중요한 이유
뉴욕 Mt. Sinai 병원의 내과 전문의이자 신장 전문의인 Girish N. Nadkarni 박사는 AI 혈액 해석 서비스를 판매하는 회사가 이를 식별되지 않은 환자 데이터와 후향적으로 비교하고 AI 결과를 전문가의 결과와 비교하는 전향적 연구에 사람들을 등록함으로써 성공을 입증해야 한다고 주장합니다.
Mt. Sinai의 Hasso Plattner 디지털 건강 연구소 소장이자 AI 건강 연구원인 Nadkarni는 “인간은 100% 정확하지 않기 때문에 어떤 것도 성공하기 위해 100% 정확도를 가져야 한다고 생각하지 않습니다.”라고 말합니다. “하지만 이 모델의 정확도가 얼마나 되는지 모르기 때문에 대화가 정말 힘들어집니다. 어떻게 작동하고 어디에서 실패하나요?”
Nadkarni는 현재의 AI 혈액 검사 제품이 대다수의 환자에게 “괜찮을” 수 있지만, 불안을 유발하고 잠재적으로 유해한 추가 검사를 유발하는 진단 누락이나 허위 양성과 같은 극단적인 문제가 나타날 수 있다고 말했습니다.
Levels의 CEO인 Josh Clemente는 빈번한 혈액 검사를 옹호합니다. 비용이 문제가 되지 않는다면 Clemente는 사전 예방적인 건강 모니터링을 위해 일반적인 연간 신체 검사보다 훨씬 더 자주 실험실 작업을 권장할 것입니다.
신진대사 건강에 초점을 맞춘 레벨스는 구독 계획을 “더 건강하고 오래 살기” 위한 방법으로 마케팅합니다. 각 계층에서는 혈당 모니터링과 함께 회사의 앱 및 독점 대시보드에 대한 액세스를 제공합니다. 그러나 연간 499달러와 1,499달러에 제공되는 두 가지 계층에만 실험실 작업, 임상의 검토 보고서 및 AI 건강 통찰력이 포함됩니다.
Clemente는 현재 의학 기사 및 바이오마커 연구에 대한 교육도 받은 Levels AI 제품과 다이어트, 체중 감량, 호르몬과 같은 주제에 대한 대사 전문가가 출연하는 Levels 블로그 게시물 및 팟캐스트에 Claude와 Gemini를 선호합니다.
AI 제품은 이러한 정보 계층과 가드레일에서 통찰력을 얻고, 의사는 소비자가 받는 모든 실험실 작업 보고서를 검토합니다. 또한 앱 기반 AI 챗봇은 레벨 전문가 콘텐츠를 활용하여 콜레스테롤 및 포도당과 같은 바이오마커를 개선할 수 있는 라이프스타일 변화를 권장합니다.
“우리는 이를 임상의 지원 도구로 다시 사용하고 있습니다. 제 생각에는 이것이 오늘날 이러한 도구를 사용하는 올바른 방법입니다.”라고 Clemente는 말합니다. Levels는 현재 AI 제품의 정확성에 대한 독립적인 연구를 수행하지 않습니다.
Nadkarni는 인간의 감독을 지지하지만 이것이 안전 장치라고 생각하지 않도록 소비자에게 경고합니다. 대신 의사들은 자신도 모르게 자동화 편견이나 AI 결과를 고무 스탬프로 찍는 경향의 희생양이 될 수 있습니다.
AI가 혈액검사 결과를 정말로 개인화할 수 있을까?
축구 스타 크리스티아누 호날두(Cristiano Ronaldo)와 쿼터백 패트릭 마홈스(Patrick Mahomes) 같은 운동선수들이 유명하게 만든 웨어러블 기기인 Whoop은 지난 가을에 혈액 검사를 제공하기 시작했습니다. 연간 1회 시험 비용은 $199이지만 회원은 $899로 1년에 6회 시험을 볼 수 있습니다. 회사는 Quest와 협력하여 실험실 작업을 수행하고 Levels와 마찬가지로 의사가 결과를 검토하도록 합니다.
Whoop의 제품 담당 부사장인 Alexi Coffey는 회사의 AI 제품이 OpenAI와 개별 회원 데이터를 기반으로 한다고 말합니다. 그녀는 회사가 AI의 정확성에 대한 임상 연구를 추구하고 있는지 여부에 대해서는 언급을 거부했습니다.
Coffey는 “우리는 사물 간의 관계를 과도하게 주장하거나 과도하게 제안하고 싶지는 않습니다. 하지만 연결될 수 있는 사물을 이해하도록 도와줌으로써 회원들에게 가치를 제공하고 싶습니다”라고 말합니다.
Coffey는 심박수, 수면의 질, 운동 패턴 등 생리학적 데이터를 혈액 작업 보고서에 통합하는 Whoop의 능력이 고객에게 고유한 건강 통찰력을 제공한다고 말합니다.
예를 들어, 고객이 채혈 전날 마라톤을 뛰었다면 AI는 염증 바이오마커를 해석할 때 신체적 스트레스를 고려할 수 있습니다. (Whoop은 실제로 결과에 영향을 미칠 수 있으므로 혈액 채취 전에 격렬한 신체 활동을 피하라고 회원들에게 조언합니다.)
AMA의 Whyte는 이것이 유망해 보이지만 그러한 AI 애플리케이션이 “진정으로 개인화”되었음을 입증하는 증거는 없다고 말합니다.
그는 “데이터가 무엇인지 정말로 의문을 제기해야 한다고 생각합니다.”라고 말하며 기업이 개별 추천을 하려면 대규모 데이터 세트가 필요하다고 지적했습니다. 이들 회사가 해당 정보를 갖고 있다면 아직 이를 기반으로 한 동료 검토 연구를 발표하지 않은 것입니다.
혈액 검사는 중요한 진단 도구이지만 소셜 미디어의 과대 광고의 초점이기도 하며 종종 혈액 검사를 에너지 부족이나 불면증과 같은 건강 문제를 해결하기 위한 만병통치약으로 자리매김하기도 한다고 Whyte는 말합니다. 그는 소비자들에게 일부 회사에서는 “아무것도 도움이 되지 않는” 원소와 광물을 측정한다고 경고합니다. 호르몬 수치 테스트도 수행 방법에 따라 마찬가지로 쓸모가 없을 수 있습니다.
과학적 연구가 AI 혈액 검사 해석의 정확성과 의미를 확립할 때까지 Whyte는 환자에게 개인화된 통찰력을 생성하는 기술에 의존하기보다는 AI를 사용하여 결과를 명확하게 설명할 것을 권장합니다.
“사람들은 실험실 테스트가 흑백이고 질병이 있는지 없는지에 대한 최종 결정자라고 생각합니다”라고 Whyte는 말합니다. “그리고 그게 항상 사실은 아니죠.”
__________________________________________________________________________________________
이 기사에 포함된 정보는 교육 및 정보 제공의 목적으로만 제공되며 건강 또는 의학적 조언을 위한 것이 아닙니다. 의학적 상태나 건강 목표에 관해 궁금한 점이 있으면 항상 의사나 기타 자격을 갖춘 의료 서비스 제공자와 상담하세요.
공개: Mashable의 모회사인 Ziff Davis는 2025년 4월 OpenAI가 AI 시스템 교육 및 운영에 있어 Ziff Davis의 저작권을 침해했다고 주장하며 OpenAI를 상대로 소송을 제기했습니다.