Zephyrnet-logo

Kun je ChatGPT gebruiken om medisch onderzoek te doen? – Regenexx

Datum:

Als je deze blog regelmatig leest, weet je dat ik een grote fan ben van AI en voorspel dat het de wetenschap en geneeskunde ten goede zal veranderen. Toen ChatCPT de afgelopen maanden echter in beeld kwam, beweerden verschillende collega's dat je het nu kunt gebruiken om online medisch onderzoek te doen en tekst te genereren voor medische onderzoeksdocumenten. Daarom probeerde ik dit uit, maar de resultaten die ik kreeg waren aanvankelijk zorgwekkend en uiteindelijk misschien wel veelbelovend, maar verdere analyse toonde aan dat ik gevaarlijk werd vervalst. Laten we in dit onderwerp duiken.

AI-bots

ChatGPT is een project gestart door OpenAI. Google Bard is een versie van hetzelfde concept. Kortom, u gebruikt grote neurale netwerken die worden gevoed door beheerde stukjes en beetjes internet. Deze machines proberen te raden wat er daarna komt terwijl mensen antwoorden classificeren. De juiste antwoorden versterken bepaalde neurale verbindingen in de software en verzwakken de verkeerde.

Beide tools zijn op dit moment een beetje hyped, maar naarmate ze evolueren, lijdt het geen twijfel dat de mogelijkheid om een ​​AI het gromwerk te laten doen van het onderzoeken van de medische literatuur, de geneeskunde zal helpen sneller vooruit te gaan. Als een AI-bot bijvoorbeeld nauwkeurig de medische literatuur kan doorzoeken en conclusies kan trekken uit tientallen of honderden referenties en referenties kan aanhalen over hoe hij tot die conclusie is gekomen, kunnen wetenschappers verbanden tussen dingen zien in seconden in plaats van weken zoeken.

Vind een Regenexx-vestiging bij u in de buurt

94 klinieklocaties bieden niet-chirurgische Regenexx-oplossingen voor musculoskeletale pijn.

94 klinieklocaties bieden niet-chirurgische Regenexx-oplossingen voor musculoskeletale pijn.

Zoek een locatie

Collega's die AI gebruiken om te schrijven

Verschillende collega's beweren dat ze ChatGPT nu gebruiken om inleidingen voor papers te schrijven of om verschillende onderwerpen te onderzoeken. Een van hen beweerde dat dit transformerend was en hem veel tijd bespaarde. Vandaar dat ik dacht dat het tijd was om het een kans te geven.

Mijn AI Medical Research Quest

Ik heb gemerkt dat er bij sommige van mijn jonge CCI-patiënten aanwijzingen zijn voor osteofyten (botsporen) in de craniocervicale overgang. Gezien het feit dat dit op basis van mijn medische ervaring anders zeldzaam zou zijn om te zien; Ik wilde onderzoeken hoe vaak dit wordt gemeld bij normale jonge volwassenen. Dit betekent dat als het zelden wordt gezien bij overigens gezonde mensen in toegewijde onderzoeksstudies, het een ander teken van instabiliteit is, omdat we weten dat botsporen zich vormen in die spinale aandoening. Als het vaker voorkomt dan ik dacht, dan is het misschien gewoon een willekeurige bevinding bij mijn patiënten en niet veroorzaakt door hun craniocervicale instabiliteit.

Mijn eerste diepe duik was kijken naar deze prevalentie in de craniocervicale overgang. Ik sloeg de eerste PubMed- en Google-zoekopdrachten door, volgde het advies van mijn collega op en gebruikte ChapGPT en Bard. Dat bleek nutteloos, waarschijnlijk omdat er zoveel termen zijn voor de craniocervicale niveaus. Dit betekent dat je dit de craniocervicale overgang kunt noemen, atalontoaxiaal, atlantodentaal, atlantoodontoïde, enz... Hoe slecht deze diensten met dit verzoek omgingen, wekte zeker mijn interesse, dus besloot ik mijn zoekopdracht te beperken tot één ruggengraatniveau op C2-C3 en de resultaten te vergelijken en te contrasteren .

De vraag, die ik op verschillende manieren formuleerde, was eenvoudig. Schrijf een kort wetenschappelijk artikel over de prevalentie van botsporen (osteofyten) op de C2-C3 in vergelijking met andere niveaus van de nek.

Door tientallen jaren medische literatuur te lezen, duizenden MRI's en CT-scans van de cervicale wervelkolom te lezen en een half leven lang arts te zijn, weet ik dat het juiste antwoord is dat er veel minder botsporen in de bovenste nek zijn bij C2- C3 in vergelijking met lagere cervicale niveaus (zoals C5-C6 bijvoorbeeld waar ze vaak voorkomen op middelbare leeftijd).

Ik heb eerst Google Bard geprobeerd:

Wat ik terugkreeg was erg gevaarlijk. Waarom? Bard creëerde een hele tabel die er gezaghebbend uitzag en waarin de prevalentie van osteofyten op verschillende spinale niveaus werd vergeleken. Zoals je hierboven kunt zien, was de prevalentie bij C2-C3 gekoppeld aan 40%, wat hoger was dan het percentage dat werd gerapporteerd voor C5-C6, het meest waarschijnlijke niveau in de wervelkolom om botsporen te vinden. Zoals ik kan zien, heeft het deze tabel samengesteld of deze getallen uit een willekeurige bron uit hun verband gehaald.

De volgende stap was ChatGPT:

Dit is niet gevaarlijk, maar het is slechts een alinea met zinloze rotzooi die op de pagina wordt uitgebraakt. Het verwijst naar een onderzoek dat niet eens het gevraagde niveau omvatte, namelijk C2-C3.

Vervolgens ging ik terug naar Bard en herformuleerde mijn vraag door hem te vragen wetenschappelijke referenties op te nemen:

Hier kreeg ik drie onderzoeken terug, één op punt (hierboven gemarkeerd) en twee die niets met mijn vraag te maken hadden. Deze twee waren gericht op de invloed van C2-C3 osteofyten op slikken. Dus ik zou zeggen dat dit misschien iets beter is dan een simpele Google-zoekopdracht, omdat ik een nieuwe studie heb gevonden om te lezen.

Uiteindelijk keerde ik terug naar ChatGPT na een upgrade van de oude 3.5-versie naar de nieuwe 4.0. Dit is wat ik terug kreeg:

De eerste paragraaf die ik benadrukte, citeert een studie die nooit naar het C2-C3-niveau keek en zonder geciteerd bewijs tot de conclusie kwam dat dit niveau minder osteofyten had. Het goede nieuws is dat de gok correct is, maar ChatGPT kan niet verwijzen naar hoe het daar terecht is gekomen. De tweede alinea is ronduit bizar omdat er een paardenstudie in staat. Dat is misschien logisch, aangezien ik nooit heb gezegd dat het alleen mensen omvatte. Vervolgens vroeg ik ChatGPT 4 naar de relatieve prevalentie en zorgde ervoor dat het wist dat ik het alleen over mensen had. Dit is het resultaat:

Dat maakte de paardenstudie overbodig, en nogmaals, het raadde het juiste antwoord, en nu erkende het tenminste dat het geen onderzoekscitaten had over de prevalentie van osteofyten op C2-C3-niveau.

Ik keerde toen terug naar Bard en stelde dezelfde vraag die ik eerder had gesteld: “Hoe vaak komen C2-C3 osteofyten voor in vergelijking met andere cervicale niveaus? Voeg wetenschappelijke referenties toe.” Net als het tweede antwoord van ChatCPT 4 was het veel beter:

Dit Bard-antwoord is wat ik had verwacht van een kerel die deze opdracht kreeg om mee terug te keren. Echter, deze referenties die Bard aanhaalde, bestaan ​​bijna niet voor zover ik kan zien! Ze lijken helemaal verzonnen. 

Waarom verbeterden beide AI-services met herhaalde vragen? Zou het kunnen dat ik de enige mens op aarde was die deze vraag stelde sinds deze AI-tools werden gemaakt? Dat is mogelijk omdat de expertise op het gebied van CCI wereldwijd beperkt is tot minder dan een dozijn personen. Mijn beste gok is dat beiden aan het leren waren terwijl ik deze soortgelijke vragen stelde. Bard lijkt sneller aangeslagen te zijn dan ChatGPT 4, maar zoals hierboven besproken, kwam het daar door onderzoekscitaten te produceren.

Doe mee met een gratis Regenexx-webinar.

De goede de slechte en de lelijke

Uiteindelijk zijn de antwoorden allemaal eng slecht. Als een patiënt of een jonge arts bijvoorbeeld met de tafel was meegegaan en beweerde dat de prevalentie van botsporen bij C2-C3 40% was en afnam naarmate u in de nek naar lagere cervicale niveaus ging, zou dat achterwaartse verkeerde informatie zijn geweest. Of als u had vertrouwd op de referenties in het laatste Bard-antwoord, zou u hebben vertrouwd op informatie die niet bestaat. Daarom zou ik geen van beide diensten vertrouwen om medisch onderzoek uit te voeren.

Het resultaat? Dit zullen fantastische hulpmiddelen voor medisch onderzoek zijn naarmate ze zich de komende jaren ontwikkelen. Dit zal het tempo van medische innovatie verhogen, aangezien deze diensten nauwkeuriger worden dan mensen en honderden medische onderzoeksdocumenten kunnen doorzoeken om binnen enkele seconden nauwkeurige conclusies te trekken. Ik zou echter zeer voorzichtig zijn met het gebruik ervan om iets medisch te onderzoeken.

Chris Centeno, MD is een specialist in regeneratieve geneeskunde en het nieuwe gebied van interventionele orthopedie. Centeno pionierde in 2005 met orthopedische stamcelprocedures en is verantwoordelijk voor een groot deel van het gepubliceerde onderzoek naar het gebruik van stamcellen voor orthopedische toepassingen.
Bekijk profiel

Als u vragen of opmerkingen heeft over deze blogpost, kunt u ons mailen op [e-mail beveiligd]

OPMERKING: Deze blogpost bevat algemene informatie om de lezer te helpen regeneratieve geneeskunde, musculoskeletale gezondheid en aanverwante onderwerpen beter te begrijpen. Alle inhoud in deze blog, website of gelinkte materialen, inclusief tekst, afbeeldingen, afbeeldingen, patiëntprofielen, uitkomsten en informatie, is niet bedoeld en mag niet worden beschouwd of gebruikt als vervanging voor medisch advies, diagnose of behandeling . Raadpleeg altijd een professionele en gecertificeerde zorgverlener om te bespreken of een behandeling geschikt voor u is.

Regenexx-updates in uw inbox

Word lid van onze gratis nieuwsbrief.

Word lid van de Regenexx-nieuwsbrief

Aanmelden Blog

spot_img

Laatste intelligentie

spot_img