شعار زيفيرنت

هل يمكنك استخدام ChatGPT لإجراء البحوث الطبية؟ - Regenexx

التاريخ:

إذا كنت تقرأ هذه المدونة بانتظام، فستعلم أنني من أشد المعجبين بالذكاء الاصطناعي وأتوقع أنه سيغير العلوم والطب نحو الأفضل. ومع ذلك، مع التركيز على ChatCPT في الأشهر القليلة الماضية، ادعى العديد من الزملاء أنه يمكنك الآن استخدامه لإجراء بحث طبي عبر الإنترنت وإنشاء نص لأوراق البحث الطبي. ومن ثم، جربت ذلك، لكن النتائج التي حصلت عليها كانت مثيرة للقلق في البداية، وفي النهاية ربما كانت واعدة، لكن التحليل الإضافي أظهر أنني تعرضت للتحايل بشكل خطير. دعونا نحفر في هذا الموضوع.

روبوتات الذكاء الاصطناعي

ChatGPT هو مشروع بدأته OpenAI. Google Bard هو نسخة من نفس المفهوم. في الأساس، أنت تستخدم شبكات عصبية كبيرة تغذي أجزاء وأجزاء من الإنترنت. تحاول هذه الآلات تخمين ما سيأتي بعد ذلك عندما يصنف البشر الاستجابات. تعمل الإجابات الصحيحة على تقوية بعض الروابط العصبية في البرنامج وإضعاف الروابط الخاطئة.

كل من هاتين الأداتين يتم الترويج لهما بعض الشيء في الوقت الحالي، ولكن مع تطورهما، ليس هناك شك في أن القدرة على جعل الذكاء الاصطناعي يقوم بالعمل الشاق المتمثل في البحث في الأدبيات الطبية سيساعد الطب على التقدم بسرعة أكبر. على سبيل المثال، إذا كان بإمكان روبوت الذكاء الاصطناعي البحث بدقة في الأدبيات الطبية واستخلاص استنتاجات من عشرات أو مئات المراجع والاستشهاد بالمراجع لكيفية وصوله إلى هذا الاستنتاج، فسيتمكن العلماء من رؤية الروابط بين الأشياء في ثوانٍ بدلاً من أسابيع من البحث.

ابحث عن موقع Regenexx بالقرب منك

94 موقع عيادة تقدم حلول Regenexx غير الجراحية لألم العضلات والعظام.

94 موقع عيادة تقدم حلول Regenexx غير الجراحية لألم العضلات والعظام.

العثور على الموقع

الزملاء يستخدمون الذكاء الاصطناعي للكتابة

يزعم العديد من الزملاء أنهم يستخدمون الآن ChatGPT للمساعدة في كتابة مقدمات للأوراق البحثية أو البحث في مواضيع مختلفة. ادعى أحدهم أن هذا كان تحويليًا ووفر له الكثير من الوقت. ومن ثم، اعتقدت أن الوقت قد حان لأعطيها فرصة.

مهمتي البحثية الطبية في مجال الذكاء الاصطناعي

لقد لاحظت أنه لدى بعض مرضى CCI الصغار، يوجد دليل على وجود نبتات عظمية (نتوءات عظمية) في الوصل القحفي العنقي. وبالنظر إلى ذلك بناءً على خبرتي الطبية، سيكون من النادر رؤية هذا؛ كنت أرغب في البحث عن مدى شيوع الإبلاغ عن ذلك لدى الشباب العاديين. وهذا يعني أنه إذا كان نادرًا ما يُرى في الأشخاص الأصحاء في دراسات بحثية مخصصة، فهذه علامة أخرى على عدم الاستقرار، لأننا نعلم أن نتوءات العظام تتشكل في حالة العمود الفقري تلك. إذا كان الأمر أكثر شيوعًا مما كنت أعتقد، فربما يكون مجرد نتيجة عشوائية لدى مرضاي وليس بسبب عدم استقرار القحفي العنقي لديهم.

كان أول بحث عميق لي هو النظر في هذا الانتشار في التقاطع القحفي العنقي. لقد قمت بالبحث الأولي في PubMed وGoogle، وأخذت بنصيحة زميلي، واستخدمت ChapGPT وBard. وقد ثبت عدم جدوى ذلك، على الأرجح بسبب وجود مصطلحات كثيرة لمستويات القحفي العنقي. وهذا يعني أنه يمكنك تسمية هذا بالموصل القحفي العنقي، والموصل الفكي المحوري، والمفصل الفكي السني، والمفصل الفكي السني، وما إلى ذلك... من المؤكد أن مدى سوء أداء هذه الخدمات مع هذا الطلب أثار اهتمامي، لذلك قررت تضييق نطاق بحثي إلى مستوى فقري واحد عند C2-C3 ومقارنة النتائج وتباينها. .

كان السؤال، الذي صغته بعدة طرق مختلفة، بسيطًا. اكتب بحثًا علميًا قصيرًا عن مدى انتشار النتوءات العظمية (النابتات العظمية) عند مستوى C2-C3 مقارنة بالمستويات الأخرى في الرقبة.

من خلال عقود من قراءة الأدبيات الطبية، وقراءة الآلاف من صور الرنين المغناطيسي والأشعة المقطعية للعمود الفقري العنقي، ونصف عمري كطبيب، أعلم أن الإجابة الصحيحة هي أن هناك نتوءات عظمية أقل بكثير في الجزء العلوي من الرقبة عند النقطة C2-. C3 عند مقارنتها بمستويات عنق الرحم المنخفضة (مثل C5-C6 على سبيل المثال حيث تكون شائعة في منتصف العمر).

لقد جربت Google Bard لأول مرة:

ما عدت إليه كان خطيرًا جدًا. لماذا؟ أنشأ بارد جدولًا كاملاً بدا موثوقًا يقارن فيه مدى انتشار النابتات العظمية على مستويات العمود الفقري المختلفة. كما ترون أعلاه، في C2-C3، ربط معدل الانتشار بنسبة 40٪، وهو أعلى من النسبة المبلغ عنها لـ C5-C6، وهو المستوى الأكثر احتمالاً في العمود الفقري للعثور على نتوءات العظام. بقدر ما أستطيع أن أقول، فقد قامت بتكوين هذا الجدول أو سحبت هذه الأرقام من مصدر عشوائي خارج السياق.

التالي كان ChatGPT:

هذا ليس خطيرًا ولكنه مجرد فقرة من القمامة التي لا معنى لها متجددة على الصفحة. إنه يشير إلى دراسة لم تتضمن حتى المستوى المطلوب عنه، وهو C2-C3.

بعد ذلك، عدت إلى بارد وأعدت صياغة سؤالي بأن أطلب منه تضمين المراجع العلمية:

هنا حصلت على ثلاث دراسات، واحدة في النقطة (الموضحة أعلاه) واثنتان لا علاقة لهما بسؤالي. وقد ركز هذان الاثنان على كيفية تأثير النابتات العظمية C2-C3 على البلع. لذلك أود أن أقول إن هذا ربما يكون أفضل بشكل هامشي من بحث بسيط على Google لأنني وجدت دراسة جديدة لقراءتها.

أخيرًا، عدت إلى ChatGPT بعد الترقية من الإصدار 3.5 القديم إلى الإصدار 4.0 الجديد. وهذا ما عدت إليه:

تستشهد الفقرة الأولى التي سلطت الضوء عليها بدراسة لم تنظر مطلقًا إلى مستوى C2-C3 وتوصلت إلى نتيجة مفادها أن هذا المستوى يحتوي على عدد أقل من النابتات العظمية دون وجود أدلة مستشهد بها. والخبر السار هو أن التخمين صحيح، لكن ChatGPT لا يمكنه الإشارة إلى كيفية وصوله إلى هناك. الفقرة الثانية غريبة تمامًا لأنها تتضمن دراسة للخيول. قد يكون هذا منطقيًا، لأنني لم أطلب مطلقًا أن يشمل البشر فقط. بعد ذلك، سألت ChatGPT 4 عن الانتشار النسبي وتأكدت من أنه يعلم أنني كنت أتحدث فقط عن البشر. وهذه هي النتيجة:

أدى ذلك إلى التخلص من دراسة الخيول، ومرة ​​أخرى، خمنت الإجابة الصحيحة، وعلى الأقل الآن أدركت أنها لا تملك الاستشهادات البحثية حول انتشار النابتات العظمية على مستوى C2-C3.

عدت بعد ذلك إلى بارد وطرحت نفس السؤال الذي طرحته من قبل: "ما مدى شيوع النابتات العظمية C2-C3 مقارنة بمستويات عنق الرحم الأخرى؟ تضمين المراجع العلمية." مثل الرد الثاني من ChatCPT 4، كان أفضل بكثير:

رد Bard هذا هو ما كنت أتوقع أن يعود به زميل تم تكليفه بهذه المهمة. ومع ذلك، فإن هذه المراجع التي استشهد بها بارد، على ما أستطيع أن أقول، غير موجودة! يبدو أنهم مكونون بالكامل. 

لماذا تحسنت كلتا خدمتي الذكاء الاصطناعي مع الأسئلة المتكررة؟ هل من الممكن أنني كنت الإنسان الوحيد على وجه الأرض الذي طرح هذا السؤال منذ أن تم إنشاء أدوات الذكاء الاصطناعي هذه؟ وهذا ممكن لأن الخبرة في CCI تقتصر على أقل من عشرة أفراد في جميع أنحاء العالم. أفضل تخميني هو أن كلاهما كانا يتعلمان عندما طرحت هذه الأسئلة المماثلة. يبدو أن Bard قد استوعب بشكل أسرع من ChatGPT 4، ولكن كما تمت مراجعته أعلاه، فقد وصل إلى هناك من خلال الاستشهادات البحثية المصنعة.

انضم إلينا في ندوة ويب Regenexx مجانية.

الجيد، السيء والقبيح

وفي النهاية، الإجابات كلها سيئة بشكل مخيف. على سبيل المثال، إذا وافق مريض أو طبيب شاب على الجدول مدعيًا أن معدل انتشار النتوءات العظمية في C2-C3 كان 40% وانخفض مع نزولك في الرقبة إلى مستويات أقل في عنق الرحم، فسيكون ذلك بمثابة معلومات خاطئة رجعية. أو لو اعتمدت على المراجع في إجابة بارد النهائية لاعتمدت على معلومات غير موجودة. ومن ثم، لا أثق في أي من الخدمتين لإجراء البحوث الطبية.

النتيجة؟ وستكون هذه أدوات بحث طبية رائعة أثناء تطورها خلال السنوات القليلة المقبلة. سيؤدي ذلك إلى زيادة وتيرة الابتكار الطبي حيث أصبحت هذه الخدمات أكثر دقة من البشر ويمكنها فرز مئات الأوراق البحثية الطبية لاستخلاص استنتاجات دقيقة في ثوانٍ. ومع ذلك، سأكون حذرًا للغاية بشأن استخدامها للبحث في أي شيء طبي.

كريس سينتينو ، دكتوراه في الطب هو متخصص في الطب التجديدي والمجال الجديد لجراحة العظام التداخلية. كان Centeno رائدًا في إجراءات الخلايا الجذعية العظمية في عام 2005 وهو مسؤول عن قدر كبير من الأبحاث المنشورة حول استخدام الخلايا الجذعية لتطبيقات تقويم العظام.
عرض الصفحة الشخصية

إذا كانت لديك أسئلة أو تعليقات حول منشور المدونة هذا ، فيرجى مراسلتنا عبر البريد الإلكتروني على [البريد الإلكتروني محمي]

ملاحظة: يوفر منشور المدونة هذا معلومات عامة لمساعدة القارئ على فهم الطب التجديدي وصحة الجهاز العضلي الهيكلي والمواضيع ذات الصلة بشكل أفضل. جميع المحتويات المقدمة في هذه المدونة أو موقع الويب أو أي مواد مرتبطة ، بما في ذلك النصوص والرسومات والصور وملفات تعريف المريض والنتائج والمعلومات ، ليست مقصودة ولا ينبغي اعتبارها أو استخدامها كبديل للنصيحة الطبية أو التشخيص أو العلاج . يرجى دائمًا استشارة مقدم رعاية صحية محترف ومعتمد لمناقشة ما إذا كان العلاج مناسبًا لك.

تحديثات Regenexx في علبة الوارد الخاصة بك

انضم إلى النشرة الإخبارية المجانية.

انضم إلى النشرة الإخبارية Regenexx

اشترك في المدونة

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة