
علم پزشکی ترکیبی از دانش و هنر است، اما مایکروسافت اخیراً نشان داده که یک ربات میتواند بخش زیادی از هر دوی آنها را یاد بگیرد. در یک مطالعهی جدید که در وبسایت پیشچاپ arXiv منتشر شده، شرکت مایکروسافت اعلام کرده که هوش مصنوعی پزشکی خود با نام Diagnostic Orchestrator (MAI-DxO) توانسته در ۸۵٪ از پروندههای شرح داده شده در مجله علمیNew England Journal of Medicine، تشخیص درست ارائه دهد.
این رقم تقریباً چهار برابر بیشتر از دقت پزشکان انسانی است که تنها در حدود ۲۰٪ موارد موفق به تشخیص صحیح شدهاند.
این پروندهها بخشی از مجموعهی هفتگی این مجله هستند که به منظور به چالش کشیدن پزشکان طراحی شدهاند. مواردی پیچیده که تشخیص آنها به راحتی ممکن نیست. مایکروسافت حدود ۳۰۰ مورد از این پروندهها را انتخاب وعملکرد MAI-DxO را با عملکرد ۲۱ پزشک عمومی در ایالات متحده و بریتانیا مقایسه کرد.
برای شبیه سازی فرآیند گامبهگام تصمیم گیری در دنیای واقعی پزشکی— فرآیندی که در آن پزشکان ابتدا اطلاعات جمعآوری میکنند، سپس تحلیل کرده، آزمایش تجویز میکنند و در نهایت تصمیم میگیرند— تیم مایکروسافت چارچوبی استاندارد طراحی کرد. این چارچوب به پزشکان وهوش مصنوعی اجازه میداد تا درهر مرحله سوال بپرسند و بر اساس اطلاعات جدید، اقداماتی مانند تجویز آزمایش انجام دهند (مشابه نمودار جریان تصمیمگیری که در آن هر گام به دادههای مرحلهی قبل وابسته است).
۱۲ پزشک با مجموعهای ترکیبی از مدلهای آمادهی هوش مصنوعی مقایسه شدند؛ مدلهایی مانند:
- Claude
- DeepSeek
- Gemini
- GPT
- Gork
- LLaMA
برای شباهت بیشتر با روش واقعی تصمیمگیری پزشکان، مایکروسافت یک Orchestrator طراحی کرد؛ این طراحی شبیه سازیای از مشورت با همکاران است که پزشکان درموارد دشوار معمولاً از آن بهره میبرند.
در دنیای واقعی، هر آزمایش پزشکی هزینه دارد؛ به همین دلیل مایکروسافت آزمایشهای تجویزی هر دو گروه {پزشکان و هوش مصنوعی} را بررسی کرد تا مشخص شود کدام روش از نظر اقتصادی مقرون به صرفهتر است.
نتیجه آزمایش: MAI-DxO نه تنها در تشخیص بسیار دقیقتر عمل کرد، بلکه با میانگین ۲۰٪ هزینهی کمتر به نتیجهی نهایی رسید.
دکتر اریک توپول، رئیس پزشکی انتقالی و مدیر مؤسسه تحقیقاتی Scripps Research Translational Institute که در این پروژه مشارکت داشته، میگوید:"این افزایش چهاربرابری در دقت، فراتر از چیزی است که مطالعات قبلی نشان دادهاند. معمولاً تفاوت دقت در حد ۱۰٪ مطلق بود. بنابراین این یک جهش بزرگ محسوب میشود."
اما چیزی که بیشتر توجه او را جلب کرده، هزینه است: "هوش مصنوعی نه تنها دقیقتر، بلکه عملکردی بهمراتب ارزانتر دارد."
در حال حاضر، MAI-DxO همچنان در مرحلهی توسعه قرار دارد و هنوز در خارج از محیط های تحقیقاتی قابل استفاده نیست. با این حال، به کارگیری چنین سیستمی در علم پزشکی میتواند به کاهش خطاهای پزشکی — که بخش قابل توجهی از هزینههای حوزه سلامت را تشکیل میدهند — و افزایش بهرهوری پزشکان انسانی منجر شود؛ و در نتیجه، نتایج بهتری برای بیماران رقم بزند.
مصطفی سلیمان، مدیرعامل بخش هوش مصنوعی مایکروسافت میگوید:
"این یک نتیجهی شگفتانگیز است. فکر میکنم این فناوری دید روشنی به ما میدهد تا بتوانیم بهترین تشخیصهای تخصصی را برای تمام مردم جهان با قیمتی باورنکردنی فراهم کنیم."
او توضیح میدهد که ده سال پیش وقتی الگوریتمهای هوش مصنوعی برای اولین بار وارد علم پزشکی شدند، تمرکز آنها بر روی وظایف سادهی دوتایی مانند شناسایی تومور در تصاویر اسکن بود. اما امروز این سیستم ها قادرند مکالماتی روان و با کیفیت بسیار بالا انجام دهند، سوالات مناسب بپرسند، تحلیل دقیقی ارائه دهند و آزمایشها و مداخلات درمانی مناسب را در زمان درست پیشنهاد دهند."
دکتر دومینیک کینگ، معاون بخش هوش مصنوعی مایکروسافت، نیز به مزیت دیگری اشاره میکند:
"سیستمهای هوش مصنوعی فاقد سوگیریهای ذاتی انسانی هستند. ما انسانها اغلب دچار سوگیری تأیید (confirmation bias) هستیم. گاهی پزشکان چیزی را میبینند و با خود فکر میکنند: "مطمئنم همین مورد را هفتهی پیش در یک بیمار دیگر هم دیدم." اما هوش مصنوعی متفاوت فکر میکند."
سیستم MAI-DxO صرفاً یک پاسخ نهایی ارائه نمیدهد، بلکه فرآیند استدلال خود را نیز نمایش میدهد تا پزشکان بتوانند منطق پشت تشخیص را بررسی کنند.
مصطفی سلیمان میافزاید:
"این سیستم طوری طراحی شده که برای نظارت هم زمان و در لحظه توسط پزشک انسانی قابل استفاده باشد. این سطح از شفافیت در فرآیند تفکر، پیشتر در هیچ سیستم هوش مصنوعی دیده نشده بود."
همچنین این قابلیت میتواند به آموزش و تربیت پزشکان کمک کند، دقت تشخیص را افزایش دهد و در نهایت، به بهبود نتایج درمانی بیماران منجر شود.
با این حال، کیت درایر، مدیر ارشد علوم داده در بیمارستان عمومی ماساچوست و Brigham and Women's Hospital میگوید:
"بهنظر من آنها هیچ مدلی را که برای مراقبتهای درمانی بهینهسازی شده باشد آزمایش نکردهاند. بلکه صرفاً در حال بررسی استفادهی همزمان از مدلهای موجود و ترکیب تصمیمگیری آنها هستند. این بخش از کار برای من عجیب نیست."
او به نکتهی مهم دیگری هم اشاره میکند:
"این نتایج به خودیِ خود به معنای آن نیستند که چنین سیستمهایی یک گام به تأیید سازمانهایی نظیرFDA نزدیکتر شدهاند."
درایر تأکید میکند هنوز مشخص نیست که آیا این سیستمها اصلاً به عنوان "ابزار پزشکی" شناخته خواهند شد یا نه، چرا که سازمان غذا و داروی آمریکا هنوز موضع رسمی خود را در اینباره اعلام نکرده است.
مایکروسافت تنها شرکتی نیست که در زمینهی توسعهی سیستمهای هوش مصنوعی برای تشخیص بیماریها فعالیت میکند.
گوگل نیز در حال ساخت یک سیستم مکالمه محور است که تعامل میان پزشک و بیمار را شبیه سازی میکند؛ سیستمی که میکوشد روش استدلال پزشکان را بازسازی کند — از جمعآوری اطلاعات گرفته تا تحلیل علائم برای رسیدن به یک تشخیص نهایی.
در آزمایشهای اولیه، این سیستم عملکردی بهتر از پزشکان انسانی در مطالعات موردی شبیه سازی شده داشت. بهویژه در آزمایشی در سال ۲۰۲۴ — که شباهت زیادی به مطالعهی اخیر مایکروسافت داشت — نسخهی اولیهی سیستم گوگل توانست در ۵۹٪ موارد، تشخیص صحیح ارائه دهد؛ درحالیکه دقت پزشکان تنها ۳۳٪ بود.
با این حال، آزمون واقعی زمانی آغاز میشود که این سیستمها در محیطهای درمانی واقعی به کار گرفته شوند.
مرحلهی بعدی بررسی این است که هوش مصنوعی چگونه میتواند در فرآیند تشخیص بیماری، مکمل یا تقویت کنندهی نقش پزشکان باشد.
دکتر توپول میگوید:
"آنچه انجام شده، واقعاً چشمگیر است. اما تا زمانی که در دنیای واقعی پزشکی به کار گرفته نشود، تأثیری در رویهی بالینی نخواهد داشت."
او امیدوار است این سیستمها در مراکز درمانی مختلف و در مواجهه با موارد متنوع تر آزمایش شوند، جایی که بتوان آنها را با پزشکان انسانی مقایسه کرد.
اما این موضوع نیازمند اجرای کارآزماییهای بالینی در مقیاس وسیع است و همچنین دریافت تأییدیه از نهادهای نظارتی تا اطمینان حاصل شود که بیماران در معرض خطرات احتمالی ناشی از اتکای بیش از حد به تصمیمگیریهای مبتنی بر هوش مصنوعی قرار نگیرند.
دکتر دومینیک کینگ میگوید:
"ما در مسیر ایجاد یک پایهی شواهد علمی قابل اعتماد برای حمایت از پزشکان و بیماران هستیم تا بتوانیم واقعاً تغییری مثبت در سلامت افراد ایجاد کنیم."
اگر این نتایج در شرایط واقعی نیز تأیید شوند، میتوانند زمینهساز دسترسی جهانی به تخصص پزشکی با کیفیت بالا شوند (حتی در مناطق محرومی که دسترسی به خدمات پیشرفتهی پزشکی ندارند).
مصطفی سلیمان در پایان میگوید:
"تمرکز اصلی من در پنج سال آینده این است که مطمئن شوم همهی مردم جهان، در هر نقطهای، به بهترین توصیههای پزشکی دسترسی دارند. ما از این مسیر، هیجانزدهایم."
منبع: https://www.quantamagazine.org/for-algorithms-a-little-memory-outweighs-a-lot-of-time-20250521/