إذا كنت تقرأ هذه المدونة بانتظام، فستعلم أنني من أشد المعجبين بالذكاء الاصطناعي وأتوقع أنه سيغير العلوم والطب نحو الأفضل. ومع ذلك، مع التركيز على ChatCPT في الأشهر القليلة الماضية، ادعى العديد من الزملاء أنه يمكنك الآن استخدامه لإجراء بحث طبي عبر الإنترنت وإنشاء نص لأوراق البحث الطبي. ومن ثم، جربت ذلك، لكن النتائج التي حصلت عليها كانت مثيرة للقلق في البداية، وفي النهاية ربما كانت واعدة، لكن التحليل الإضافي أظهر أنني تعرضت للتحايل بشكل خطير. دعونا نحفر في هذا الموضوع.
روبوتات الذكاء الاصطناعي
ChatGPT هو مشروع بدأته OpenAI. Google Bard هو نسخة من نفس المفهوم. في الأساس، أنت تستخدم شبكات عصبية كبيرة تغذي أجزاء وأجزاء من الإنترنت. تحاول هذه الآلات تخمين ما سيأتي بعد ذلك عندما يصنف البشر الاستجابات. تعمل الإجابات الصحيحة على تقوية بعض الروابط العصبية في البرنامج وإضعاف الروابط الخاطئة.
كل من هاتين الأداتين يتم الترويج لهما بعض الشيء في الوقت الحالي، ولكن مع تطورهما، ليس هناك شك في أن القدرة على جعل الذكاء الاصطناعي يقوم بالعمل الشاق المتمثل في البحث في الأدبيات الطبية سيساعد الطب على التقدم بسرعة أكبر. على سبيل المثال، إذا كان بإمكان روبوت الذكاء الاصطناعي البحث بدقة في الأدبيات الطبية واستخلاص استنتاجات من عشرات أو مئات المراجع والاستشهاد بالمراجع لكيفية وصوله إلى هذا الاستنتاج، فسيتمكن العلماء من رؤية الروابط بين الأشياء في ثوانٍ بدلاً من أسابيع من البحث.
ابحث عن موقع Regenexx بالقرب منك
94 موقع عيادة تقدم حلول Regenexx غير الجراحية لألم العضلات والعظام.
94 موقع عيادة تقدم حلول Regenexx غير الجراحية لألم العضلات والعظام.
الزملاء يستخدمون الذكاء الاصطناعي للكتابة
يزعم العديد من الزملاء أنهم يستخدمون الآن ChatGPT للمساعدة في كتابة مقدمات للأوراق البحثية أو البحث في مواضيع مختلفة. ادعى أحدهم أن هذا كان تحويليًا ووفر له الكثير من الوقت. ومن ثم، اعتقدت أن الوقت قد حان لأعطيها فرصة.
مهمتي البحثية الطبية في مجال الذكاء الاصطناعي
لقد لاحظت أنه لدى بعض مرضى CCI الصغار، يوجد دليل على وجود نبتات عظمية (نتوءات عظمية) في الوصل القحفي العنقي. وبالنظر إلى ذلك بناءً على خبرتي الطبية، سيكون من النادر رؤية هذا؛ كنت أرغب في البحث عن مدى شيوع الإبلاغ عن ذلك لدى الشباب العاديين. وهذا يعني أنه إذا كان نادرًا ما يُرى في الأشخاص الأصحاء في دراسات بحثية مخصصة، فهذه علامة أخرى على عدم الاستقرار، لأننا نعلم أن نتوءات العظام تتشكل في حالة العمود الفقري تلك. إذا كان الأمر أكثر شيوعًا مما كنت أعتقد، فربما يكون مجرد نتيجة عشوائية لدى مرضاي وليس بسبب عدم استقرار القحفي العنقي لديهم.
كان أول بحث عميق لي هو النظر في هذا الانتشار في التقاطع القحفي العنقي. لقد قمت بالبحث الأولي في PubMed وGoogle، وأخذت بنصيحة زميلي، واستخدمت ChapGPT وBard. وقد ثبت عدم جدوى ذلك، على الأرجح بسبب وجود مصطلحات كثيرة لمستويات القحفي العنقي. وهذا يعني أنه يمكنك تسمية هذا بالموصل القحفي العنقي، والموصل الفكي المحوري، والمفصل الفكي السني، والمفصل الفكي السني، وما إلى ذلك... من المؤكد أن مدى سوء أداء هذه الخدمات مع هذا الطلب أثار اهتمامي، لذلك قررت تضييق نطاق بحثي إلى مستوى فقري واحد عند C2-C3 ومقارنة النتائج وتباينها. .
كان السؤال، الذي صغته بعدة طرق مختلفة، بسيطًا. اكتب بحثًا علميًا قصيرًا عن مدى انتشار النتوءات العظمية (النابتات العظمية) عند مستوى C2-C3 مقارنة بالمستويات الأخرى في الرقبة.
من خلال عقود من قراءة الأدبيات الطبية، وقراءة الآلاف من صور الرنين المغناطيسي والأشعة المقطعية للعمود الفقري العنقي، ونصف عمري كطبيب، أعلم أن الإجابة الصحيحة هي أن هناك نتوءات عظمية أقل بكثير في الجزء العلوي من الرقبة عند النقطة C2-. C3 عند مقارنتها بمستويات عنق الرحم المنخفضة (مثل C5-C6 على سبيل المثال حيث تكون شائعة في منتصف العمر).
لقد جربت Google Bard لأول مرة:
ما عدت إليه كان خطيرًا جدًا. لماذا؟ أنشأ بارد جدولًا كاملاً بدا موثوقًا يقارن فيه مدى انتشار النابتات العظمية على مستويات العمود الفقري المختلفة. كما ترون أعلاه، في C2-C3، ربط معدل الانتشار بنسبة 40٪، وهو أعلى من النسبة المبلغ عنها لـ C5-C6، وهو المستوى الأكثر احتمالاً في العمود الفقري للعثور على نتوءات العظام. بقدر ما أستطيع أن أقول، فقد قامت بتكوين هذا الجدول أو سحبت هذه الأرقام من مصدر عشوائي خارج السياق.
التالي كان ChatGPT:
هذا ليس خطيرًا ولكنه مجرد فقرة من القمامة التي لا معنى لها متجددة على الصفحة. إنه يشير إلى دراسة لم تتضمن حتى المستوى المطلوب عنه، وهو C2-C3.
بعد ذلك، عدت إلى بارد وأعدت صياغة سؤالي بأن أطلب منه تضمين المراجع العلمية:
هنا حصلت على ثلاث دراسات، واحدة في النقطة (الموضحة أعلاه) واثنتان لا علاقة لهما بسؤالي. وقد ركز هذان الاثنان على كيفية تأثير النابتات العظمية C2-C3 على البلع. لذلك أود أن أقول إن هذا ربما يكون أفضل بشكل هامشي من بحث بسيط على Google لأنني وجدت دراسة جديدة لقراءتها.
أخيرًا، عدت إلى ChatGPT بعد الترقية من الإصدار 3.5 القديم إلى الإصدار 4.0 الجديد. وهذا ما عدت إليه:
تستشهد الفقرة الأولى التي سلطت الضوء عليها بدراسة لم تنظر مطلقًا إلى مستوى C2-C3 وتوصلت إلى نتيجة مفادها أن هذا المستوى يحتوي على عدد أقل من النابتات العظمية دون وجود أدلة مستشهد بها. والخبر السار هو أن التخمين صحيح، لكن ChatGPT لا يمكنه الإشارة إلى كيفية وصوله إلى هناك. الفقرة الثانية غريبة تمامًا لأنها تتضمن دراسة للخيول. قد يكون هذا منطقيًا، لأنني لم أطلب مطلقًا أن يشمل البشر فقط. بعد ذلك، سألت ChatGPT 4 عن الانتشار النسبي وتأكدت من أنه يعلم أنني كنت أتحدث فقط عن البشر. وهذه هي النتيجة:
أدى ذلك إلى التخلص من دراسة الخيول، ومرة أخرى، خمنت الإجابة الصحيحة، وعلى الأقل الآن أدركت أنها لا تملك الاستشهادات البحثية حول انتشار النابتات العظمية على مستوى C2-C3.
عدت بعد ذلك إلى بارد وطرحت نفس السؤال الذي طرحته من قبل: "ما مدى شيوع النابتات العظمية C2-C3 مقارنة بمستويات عنق الرحم الأخرى؟ تضمين المراجع العلمية." مثل الرد الثاني من ChatCPT 4، كان أفضل بكثير:
رد Bard هذا هو ما كنت أتوقع أن يعود به زميل تم تكليفه بهذه المهمة. ومع ذلك، فإن هذه المراجع التي استشهد بها بارد، على ما أستطيع أن أقول، غير موجودة! يبدو أنهم مكونون بالكامل.
لماذا تحسنت كلتا خدمتي الذكاء الاصطناعي مع الأسئلة المتكررة؟ هل من الممكن أنني كنت الإنسان الوحيد على وجه الأرض الذي طرح هذا السؤال منذ أن تم إنشاء أدوات الذكاء الاصطناعي هذه؟ وهذا ممكن لأن الخبرة في CCI تقتصر على أقل من عشرة أفراد في جميع أنحاء العالم. أفضل تخميني هو أن كلاهما كانا يتعلمان عندما طرحت هذه الأسئلة المماثلة. يبدو أن Bard قد استوعب بشكل أسرع من ChatGPT 4، ولكن كما تمت مراجعته أعلاه، فقد وصل إلى هناك من خلال الاستشهادات البحثية المصنعة.
انضم إلينا في ندوة ويب Regenexx مجانية.
الجيد، السيء والقبيح
وفي النهاية، الإجابات كلها سيئة بشكل مخيف. على سبيل المثال، إذا وافق مريض أو طبيب شاب على الجدول مدعيًا أن معدل انتشار النتوءات العظمية في C2-C3 كان 40% وانخفض مع نزولك في الرقبة إلى مستويات أقل في عنق الرحم، فسيكون ذلك بمثابة معلومات خاطئة رجعية. أو لو اعتمدت على المراجع في إجابة بارد النهائية لاعتمدت على معلومات غير موجودة. ومن ثم، لا أثق في أي من الخدمتين لإجراء البحوث الطبية.
النتيجة؟ وستكون هذه أدوات بحث طبية رائعة أثناء تطورها خلال السنوات القليلة المقبلة. سيؤدي ذلك إلى زيادة وتيرة الابتكار الطبي حيث أصبحت هذه الخدمات أكثر دقة من البشر ويمكنها فرز مئات الأوراق البحثية الطبية لاستخلاص استنتاجات دقيقة في ثوانٍ. ومع ذلك، سأكون حذرًا للغاية بشأن استخدامها للبحث في أي شيء طبي.
عرض الصفحة الشخصية
إذا كانت لديك أسئلة أو تعليقات حول منشور المدونة هذا ، فيرجى مراسلتنا عبر البريد الإلكتروني على [البريد الإلكتروني محمي]
ملاحظة: يوفر منشور المدونة هذا معلومات عامة لمساعدة القارئ على فهم الطب التجديدي وصحة الجهاز العضلي الهيكلي والمواضيع ذات الصلة بشكل أفضل. جميع المحتويات المقدمة في هذه المدونة أو موقع الويب أو أي مواد مرتبطة ، بما في ذلك النصوص والرسومات والصور وملفات تعريف المريض والنتائج والمعلومات ، ليست مقصودة ولا ينبغي اعتبارها أو استخدامها كبديل للنصيحة الطبية أو التشخيص أو العلاج . يرجى دائمًا استشارة مقدم رعاية صحية محترف ومعتمد لمناقشة ما إذا كان العلاج مناسبًا لك.
تحديثات Regenexx في علبة الوارد الخاصة بك
انضم إلى النشرة الإخبارية المجانية.
انضم إلى النشرة الإخبارية Regenexx
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- تمويل EVM. واجهة موحدة للتمويل اللامركزي. الوصول هنا.
- مجموعة كوانتوم ميديا. تضخيم IR / PR. الوصول هنا.
- أفلاطونايستريم. ذكاء بيانات Web3. تضخيم المعرفة. الوصول هنا.
- المصدر https://regenexx.com/blog/can-you-use-chatgpt-to-do-medical-research/