すでに医師の平均を上回っている人工知能の診断精度
人工知能は医師の仕事をどのように奪うのか?
2017.5.3(水) 多田 智裕
인공지능은 의사의 업무를 어떻게 빼앗을 것인가?
2017.5.3 多田 智裕(타다 토모히로)
젊은 의사는 인공지능의 보급에 불안을 느끼고 있다?
"인공지능이 보급되면 의사의 일이 없어져버린다고 생각합니다만, 앞으로 어떤 것을 배워가면 좋을까요?"
"인공지능이 의사의 일을 빼앗는 것은 있을 수 없다! 그런 것을 주장하는 놈은 의사로서 상종하지 못한다, 괘씸하다!"
이것은 몇 달 전에 열린 모 학회의 한 장면입니다.
인공지능의 성능이 점점 높아져 가면 자신들의 일이 없어져버리는 것은 아닐까? 인공지능과 공존하는 시대에 어떠한 캐리어를 쌓으면 좋은 것인가 ──? 젊은 의사가 걱정하는 것도 당연하다고 생각합니다.
한편으로 지도의사가 의사의 직업이 인공지능으로 대체될 리 없다! 라며 젊은 의사를 격려하는 마음도 이해할 수 있습니다.
과연, 인공지능은 의사의 일을 어떻게 변화시킬까요?
나는, 의료현장에서 사용되는 인공지능의 특성과 실력이 어느 정도인 지를 알면, 저절로 그 길이 보이지 아닐까 생각합니다. 이 글에서는 거기에 일조하는 것으로서, 최신 의학 논문에 의한 인공지능의 평가방법과 결과를 소개하겠습니다.
진단 정확도를 평가하는 "감도"와 "특이도"
질병의 진단능력은 "감도"와 "특이도"로 검증합니다. 의학에서 "감도"란, "양성으로 판정되어야 할 것을 제대로 양성으로 판정하는 확률"을 말합니다.
질병을 진단하는 감도가 95%라는 것은, 100가지 증상의 질병 중에서 95 증상을 질병이라고 정확하게 진단했다는 것입니다. 하지만, 이 정보만으로는, 정말 그 정밀도가 높은지 낮은 지 판단을 할 수 없습니다.
만약, 어떤 사람이라도 95%의 확률로 "악성"으로 진단하면 어떨까요? 이 경우, 실제 질병을 질병이라고 진단될 확률은 95%이므로, 감도는 95%입니다. 그러나 동시에, 질병이 아닌 사람도 95%의 확률로 "질병이다"라고 진단해버리는 것입니다. 전혀 이상이 없는 사람의 거의 모두를 "질병"으로 진단하는 것이, 감도 95%가 우수하다고는 말하기 어려운 것입니다.
그래서, "특이도"검사가 필요해지고 있습니다. 이것은 "음성을 제대로 음성이라고 판정하는 확률"을 가리킵니다. 앞의 예의 경우, 감도는 95%로 높지만, 질병이 아닌 사람을 제대로 "질병이 아니다"라고 진단하는 특이도는 5%로 대단히 낮아져버립니다.
이처럼, 진단능력의 정밀도는, "감도"와 "특이도" 양쪽의 수치의 확인이 필요합니다. 그러나, 인공지능과 관련된 보도를 보면 "암을 95%의 확률로 진단했다"라는 것처럼 한쪽의 수치(아마 감도)밖에 보도하지 않는 사례를 많이 볼 수 있습니다.
감도를 높이려면 특이도를 내리면 좋은 것이기 때문에, 한쪽의 수치만 보도하는 것은 의미가 없습니다. 감도와 특이도를 모두 평가할 필요가 있는 것입니다.
최고의 의사에게는 이길 수 없지만 의사의 평균치를 넘어서
여기까지 이해하셨다면, 위의 그림을 참조하십시오. 이 그림은 어디까지나 이 칼럼용으로 이미지로서 만든 것이지만, 현재 발표되는 인공지능 진단의 논문에서는(저희가 연구 중인 결과를 포함해)인공지능의 진단 정확도는 대부분 이와 같은 형태가 됩니다.
그래프에서는 곡선이 인공지능의 진단 정확도가 됩니다. 반면, 인간의사의 진단정확도는 빨간 점으로 표시되어 있습니다(인공지능의 감도와 특이도는 프로그래밍에서 조정할 수 있으므로, 연속적인 곡선으로 나타낼 수 있습니다. 한편, 인간의사의 진단정확도는 사람에 의해 고정되어 있기 때문에 비연속적인 점으로 표시된다는 것입니다).
이것을 보면, "감도가 높지만, 특이도가 낮은 "의사가 있거나(쓸데없이 많은 검사를 권하는 의사가 여기에 해당합니다), "특이도가 높지만, 감도가 낮은 "의사(검사를 잔뜩 권하지는 않지만, 질병의 발견이 늦어지는 경우도 많다)가 있거나 하는 것을 알 수 있습니다.
그러나, 상위 10% 정도의 의사는, 감도도 특이도 모두 인공지능을 상회하고 있으며, 인공지능보다 적은 검사로 올바르게 질병을 검출할 수 있다는 것입니다.
또한, 녹색 점은 인간의사의 평균입니다. 인간의사의 평균보다, 인공지능 쪽이 더 앞선다는 결론이 됩니다.
지금까지 발표된 인공지능의 성능평가는, 흑색종(피부암)의 진단, 당뇨병성 망막증의 진단, 그리고 우리가 연구하고 피로리균 위염 진단 등에 관한 것입니다. 이러한 진단에서, 인공지능은 현재로서는 톱 클래스의 의사에게는 이길 수 없지만, 의사의 평균치를 웃도는 성능을 나타내고 있다고 생각하시면 대체로 올바른 인식이라고 할 수 있겠지요
인공지능이 어시스트하는 시대는 곧 온다
모두의 대화로 돌아가면, 캐리어를 쌓지않으면 인공지능 이하의 정밀도 밖에 낼 수없기 때문에, 젊은 의사가 자신의 직업에 의미가 없다고 느껴, 무엇을 해야할 지 불안해하는 것도 당연하겠지요.
한편,지도의사는 인공지능 이상의 정밀도를 낼 수 있을 것이기 때문에, 젊은의사에게 "인공지능이 인간의사를 대체할 수 있을 리가 없다" "우선은 인공지능 이상의 정밀도를 낼 수 있을 때까지 수련을 쌓아야 한다"고 지도하는 것도 당연하겠지요.
어쨌든, 인공지능 진단이 의료현장에서 의사의 어시스트로서 사용될 시대는 곧 거기까지 다가오고 있습니다. 불필요하게 두려워 하거나, 쓸모가 없다고 일방적으로 단정하는 것이 아니라, 그것을 이용해 더 나은 의료 서비스를 제공 할 수 있도록 노력하는 것이, 환자들에게 최선의 의료를 제공하는 우리 의료 종사자의 직무라고 나는 생각합니다.
http://jbpress.ismedia.jp/articles/print/49873