رئيس الدولة والرئيس الموريتاني يبحثان تعزيز علاقات التعاون وتداعيات التطورات الإقليمية
40 مليون مستخدم يطرحون أسئلة يومياً للاستفسار عن الأمور الصحية
"غوغل" و"شات جي بي تي".. من الأفضل في تشخيص الحالات الطبية؟
أنظمة ذكاء اصطناعي قادرة على فهم الحالة وتقديم تفسير متكامل
درجت لفترة طويلة عادة تزويد محركات البحث بأعراض صحية للحصول على تشخيص أولي، وكثيراً ما أثارت نتائجها الخوف في قلوب الناس، حين أكدت التطابق بين الأعراض المذكورة وأعراض أمراض خطرة. وظلت محركات البحث مثل "غوغل" لعقدين من الزمن البوابة الرئيسة للمعلومة الطبية، لكن الأعوام الأخيرة شهدت تحولاً نوعياً في سلوك المستخدمين الصحي، من إدخال الأعراض في محركات البحث إلى محاورة أنظمة ذكاء اصطناعي قادرة على فهم الحالة وتقديم تفسير متكامل، يتصدرها "تشات جي بي تي"، إذ يستخدم في السياق الصحي، بما يشمل تفسير الأعراض بصورة أولية وتبسيط التقارير الطبية وشرح الأدوية وآثارها الجانبية ودعم المرضى بالمعلومات العامة.
هذا التحول لا يعكس فقط تطور التقنية، بل إعادة تعريف لدور الوسيط المعرفي بين المريض والمعلومة الطبية. فما طبيعة التشخيص الذي تقدمه كل من الأداتين؟ وهل يمكن الاعتماد على الذكاء الاصطناعي ونماذجه اللغوية الكبيرة كمصدر تشخيص بديل عن البحث التقليدية؟
دقة أعلى
في دراسة نشرت في مارس (آذار) 2025 في مجلة (NPJ Digital Medicine)، تفاوض باحثون إسبان في أداء أربعة محركات بحث رئيسة وسبعة نماذج لغوية كبيرة، بما في ذلك "شات جي بي تي". وفي الإجابة عن 150 سؤالاً طبياً كشفت النتائج عن أنماط مثيرة للاهتمام في الدقة وحساسية الطلب وفعالية النموذج المعزز بالاسترجاع.
ووجدت الدراسة أن نماذج اللغة الكبيرة تتفوق عموماً على محركات البحث في الإجابة عن الأسئلة المتعلقة بالصحة، فبينما أجابت محركات البحث بصورة صحيحة عن 50 إلى 70 في المئة من الاستفسارات، حققت نماذج اللغة الكبيرة دقة تقارب 80 في المئة. ومع ذلك، كان أداء نماذج اللغة الكبيرة حساساً جداً لصياغة المدخلات، إذ قدمت الطلبات المختلفة نتائج متنوعة بصورة ملاحظة.
طبيعة التشخيص
محركات البحث مثل "غوغل" تعمل وفق منطق الإحالة، بحيث تعرض للسائل روابط ودراسات ومقالات وتترك له مهمة الفرز والتحليل، أما النماذج اللغوية الكبيرة فتتبع منطق التركيب فهي تستوعب السؤال أولاً، ثم تحلل السياق وتقدم إجابة مباشرة، غالباً ما تأتي بصيغة تفسيرية أو استشارية، بالتالي يمكن القول إنها أقرب لطبيب يستمع ويسأل، ثم يقدم رأياً مبدئياً مبنياً على معرفة واسعة.
لكن من المهم فهم أن هذا الاستخدام، بخاصة بالنسبة إلى المرضى، إرشادي معلوماتي لا أكثر، فالنموذج لا يمتلك كالطبيب وصولاً مباشراً إلى التاريخ الطبي الكامل للمريض ولا يجري فحوصاً ولا يتحمل أية مسؤولية قانونية.
التكامل بدل المقارنة
ومن هنا، عوضاً من طرح سؤال من الأفضل محركات البحث أم النماذج اللغوية؟ يتوجب علينا توظيف الاثنين لخدمتنا، لذا ربما الأدق أن نسأل كيف نستخدم الاثنين بذكاء؟
إذ في الحقيقة لا يتفوق أي منهما على الآخر بالمطلق، ومن هنا علينا فهم الاختلاف في الدور، فإذا كنت تبحث عن الفهم الأولي السريع والمبسط لحالة أو مصطلح طبي فـ"شات جي بي تي" يتفوق في هذه المهمة، بينما في حال احتجت مصادر علمية دقيقة أو دراسات حديثة للتحقق والتوسع، ليكن "غوغل" خيارك الأول.
أما في المواقف الحساسة التي تتطلب قراراً طبياً، فلا هذا ولا ذاك يغني عن الطبيب، وبالنهاية يظل الطبيب البشري هو المرجع النهائي، فالنماذج اللغوية مستشار ذكي، لكنها لا يمكن أن تكون طبيباً معتمداً.
الذكاء الاصطناعي
أفاد تقرير صادر عن "أوبن أيه آي" بأن أكثر من 40 مليون مستخدم يطرحون أسئلة يومياً للاستفسار عن الأمور الصحية، وأن نحو خمسة في المئة من جميع طلبات "شات جي بي تي" تتعلق بالصحة،
و200 مليون من أصل 800 مليون مستخدم أسبوعياً يطلبون في الأقل طلباً واحداً متعلقاً بالصحة كل أسبوع. هذه الطلبات لا تتعلق كلها بالتشخيص بالمعنى الطبي، بل تتوزع كالتالي 40 إلى 50 في المئة تفسير أعراض، و20 إلى 30 في المئة أدوية، و10 إلى 20 في المئة صحة نفسية، والبقية يتوزع بين التغذية والياقة والوقاية.
تشير أدلة حديثة إلى أن المستخدمين بدأوا يتعاملون مع النماذج اللغوية كبديل جزئي لمحركات البحث، بل ولدى بعضهم كمصدر موثوق للمشورة الطبية. وتشير دراسة إعلامية حديثة إلى أن نحو 30 في المئة من المستخدمين يثقون بالذكاء الاصطناعي أكثر من محركات البحث التقليدية، وتشمل الاستخدامات الأكثر شيوعاً تفسير الأعراض الأولية، وشرح نتائج التحاليل والاستفسار عن الأدوية وطلب نصائح صحية عامة.
هذا التحول مدفوع بعاملين رئيسين سهولة التفاعل اللغوي، بديل البحث بالكلمات المفتاحية،
والإجابات الموجزة المخصصة للسياق الشخصي، لكن هذا الاعتماد المتزايد يثير تساؤلات حول دقة هذه الأنظمة وحدودها.
أداء النماذج
في هذا السياق، تشير دراسات إلى أن أداء النماذج ليس ثابتاً، بعض النماذج تحقق دقة عالية في التشخيص النهائي،
لكنها ضعيفة في اختيار الفحوص المناسبة وتفسير السياق الطبي الكامل، كذلك يختلف الأداء بصورة كبيرة بحسب صياغة السؤال ومستوى التعقيد وتوفر السياق،
فالنماذج حساسة جداً لأي تغيير بسيط في صياغة السؤال، وقد تغير التشخيص بنسبة تصل إلى ما بين 30 و40 في المئة عند إدخال معلومات غير مهمة.
ويظهر فشل النماذج في مواضيع عدة منها الهلوسة في المعلومات الطبية، إذ إن النماذج تقدم إجابات دقيقة في الحالات الواضحة، لكنها قد تخترع معلومات بثقة في الحالات غير المؤكدة،
وكذلك قد تقع في المبالغة وسوء تفسير الأدلة. وفي دراسة على آلاف الملخصات الطبية، وجدت أن حتى 73 في المئة من مخرجات الذكاء الاصطناعي تضمنت مبالغات أو استنتاجات غير دقيقة.
وفي النهاية، الذكاء الاصطناعي ليس ثورة تشخيصية متكاملة في المجال الصحي بل أداة معرفية قوية، لكنها في الوقت ذاته غير مستقرة بالكامل،
وقيمتها الحقيقية اليوم ليست في استبدال الطبيب أو محركات البحث، بل في الربط بينهما، وتسخيره كوسيط ذكي بين المريض والمعلومة الطبية.