Zephyrnet-logo

NMPA klinische richtlijn uitgegeven voor AI-detectiesoftware

Datum:

NMPA heeft op 7 november 2023 de ‘Clinical Evaluation Guideline on Artificial Intelligence-assisted Detection Medical Devices (Software)’ uitgebracht.

De richtlijn verwijst naar de FDA-richtlijnen voor “Computerondersteunde detectieapparatuur toegepast op radiologische beelden en radiologische apparaatgegevens” en “Klinische prestatiebeoordeling: overwegingen voor computerondersteunde detectieapparatuur toegepast op radiologische afbeeldingen en radiologische apparaatgegevens”.

Voor een Engelstalige versie van de richtlijn kunt u een e-mail sturen info@ChinaMedDevice.com. Voor de vertaling rekenen wij een nominaal honorarium.

Klik voor de AI-softwarerichtlijn voor echografie HIER

Voor goedkeuring van AI-software voor ischemische beroertedetectie klikt u op HIER

Toepassingsgebied

AI-ondersteunde detectieapparaten verwijzen naar computergebaseerde AI-algoritmen die functies kunnen omvatten zoals patroonherkenning en gegevensanalyse. Ze helpen klinische artsen bij het nemen van overeenkomstige diagnostische en behandelbeslissingen door mogelijke gebieden van afwijkingen of laesies te identificeren, markeren en benadrukken. Dit kunnen zelfstandige software of embedded software zijn. Het zijn apparaten van klasse III. Veel voorkomende voorbeelden zijn onder meer die voor de detectie van laesies of afwijkingen die verband houden met longknobbeltjes, borstknobbeltjes, fracturen, vasculaire vernauwing en colonpoliepen.

De producten kunnen ook niet-ondersteunende beslissingsfuncties omvatten, zoals het genereren van gestructureerde rapporten, vergelijkingen van voor en na-beelden, segmentatie van normale anatomische structuren (zoals longkwabben, ribben, enz.), afmetingsmetingen, CT-waardemetingen en andere klinische functies, evenals gegevensopslag, -overdracht en andere niet-klinische functies.

Ontwerp van klinische proeven

De proeven zijn bedoeld om de diagnostische prestaties van dergelijke producten binnen de beoogde toepassingen te evalueren, inclusief hun bruikbaarheid en veiligheid. Hier volgt een samenvatting van de belangrijkste punten:

Klinische onderzoeksdoelstellingen: Klinische onderzoeken naar AI-ondersteunde diagnostische producten zijn primair gericht op het verbeteren van de nauwkeurigheid van ziektedetectie door beroepsbeoefenaren in de gezondheidszorg. Het kan gaan om gecontroleerde onderzoeken, waaronder gerandomiseerde parallelle, crossover- of MRMC-ontwerpen (multiple reader multiple case).

Onderwerpen bestuderen:

  • Beeldvormingsmonsters: Proeven maken vaak gebruik van gedefinieerde inclusie- en uitsluitingscriteria om beeldvormingsmonsters van de doelpopulatie te verzamelen. Er kan rekening worden gehouden met gegevens uit de praktijk uit de klinische praktijk.
  • Variatie van lezers: Vanwege de variabiliteit tussen lezers en hun interactie met patiëntmonsters, omvatten klinische onderzoeken vaak radiologen als proefpersonen, vooral voor niet-realtime beeldvormingsproducten.

Evaluatiestatistieken: De belangrijkste evaluatiegegevens moeten aansluiten bij de ontwerpkenmerken van het product. Gevoeligheid, specificiteit en ROC of gerelateerde diagnostische nauwkeurigheidsmetingen hebben de voorkeur als primaire eindpunten vanwege hun robuustheid tegen variaties in de ziekteprevalentie.

Klinische referentiestandaarden: Aanvragers moeten de selectie en constructie van klinische referentiestandaarden toelichten. Opties zijn onder meer het gebruik van klinisch bevestigde resultaten of oordelen van deskundigenpanels als referentiestandaarden, met duidelijke criteria voor deskundige kwalificaties en besluitvormingsprocessen.

Schatting van de steekproefomvang en statistische analyse: Bij het berekenen van de steekproefomvang moet rekening worden gehouden met het ontwerp van de proef, de primaire eindpunten en statistische vereisten. Transparantie over formules, parameters en gebruikte software is essentieel. De specifieke kenmerken van het MRMC-onderzoeksontwerp moeten worden uiteengezet, inclusief de effectgroottes, het vermogen, de alfaniveaus en de basis voor het bepalen van de drempelwaarden voor werkzaamheid/non-inferioriteit.

Klinische proeftraining: Training voor lezers, inclusief radiologen en deskundigenpanels, is van cruciaal belang om vooringenomenheid te minimaliseren. Het moet betrekking hebben op proefprocedures, terminologie en evaluatienormen voor gegevensmonsters. Het wordt aanbevolen om consistentie te handhaven tussen proeftraining en productgebruik in de echte wereld.

Kwaliteitscontrole van beeldbeoordeling: Maatregelen moeten zorgen voor blinde beoordeling door lezers, een gevarieerde lezersvertegenwoordiging en datablindering. Voor gecontroleerde onderzoeken worden cross-over-ontwerpen en geschikte uitwasperioden aanbevolen. De ontwerpkeuze moet aansluiten bij de klinische toepassing en productomvang.

Niet-diagnostische functies

Deze functies omvatten het genereren van gestructureerde rapporten, beeldvergelijking, anatomische structuursegmentatie, workflowoptimalisatie, maatmetingen en CT-waardemetingen. De veiligheid en effectiviteit ervan kunnen worden beoordeeld door middel van klinische onderzoeken of door het verstrekken van klinische evaluatiegegevens. Validatiemethoden kunnen bestaan ​​uit testen op specifieke datasets, stresstests en resultaten uit goed gekwalificeerde databases. Klinische onderzoeken kunnen secundaire eindpunten vaststellen met behulp van klinische referentiestandaarden of gevestigde academische methoden. Een goede evaluatie garandeert de betrouwbaarheid en prestaties van deze niet-ondersteunende klinische functies in AI-ondersteunde diagnostische apparaten.

Samenvatting van het klinische onderzoek: In dit gedeelte wordt de essentiële informatie uit de klinische onderzoeken samengevat, inclusief de klinische basisgegevens, evaluatiestatistieken en resultaten, eventueel inclusief subgroepanalyses indien nodig.

Toepassingsgebied: Voor AI-ondersteunde diagnostische producten moet het toepassingsgebied expliciet worden gedefinieerd. Dit omvat het specificeren van de indicaties waarvoor het product helpt bij de detectie (bijv. longknobbeltjes, fracturen), de soorten beelden waarop het is gebaseerd (bijv. CT-thorax of colonoscopiebeelden), de andere belangrijke functies van het product (bijv. beeldweergave, verwerking, meting en analyse) en de klinische rol van het product (waarbij wordt benadrukt dat het niet uitsluitend kan worden gebruikt voor klinische besluitvorming).

Het document beveelt aanvragers ook aan de volgende waarschuwingen en waarschuwingen op te nemen om een ​​veilig en passend gebruik van het product te garanderen:

Verantwoordelijkheid van de arts: De software dient als hulpmiddel voor artsen bij het detecteren van laesies en kan valse positieven of valse negatieven opleveren. Het is van cruciaal belang dat beroepsbeoefenaren in de gezondheidszorg rekening houden met de medische geschiedenis, symptomen, tekenen en andere diagnostische resultaten van de patiënt bij het nemen van definitieve beslissingen over de detectie van laesies en verdere diagnostische en behandelingsacties.

Richtlijn Updates: Gebruikers worden erop gewezen dat het ontwerp van het product gebaseerd is op specifieke richtlijnen uit een bepaald jaar (bijv. “Chest CT Long Nodule Data Labeling and Quality Control Expert Consensus (2018)”). Als er updates zijn voor deze richtlijnen, moeten gebruikers de potentiële risico's die gepaard gaan met eventuele verschillen in richtlijnen bij het gebruik van het product zorgvuldig beoordelen.

Nauwkeurigheid van grenssegmentatie: Het document moet duidelijk maken dat de klinische onderzoeken met het product de nauwkeurigheid van de laesiegrenssegmentatie niet hebben beoordeeld. In gevallen waarin een medische beslissing, zoals een chirurgische ingreep of een biopsie, gebaseerd is op de detectieresultaten van de software, moeten artsen de bijbehorende risico's grondig evalueren.

De richtlijn geeft tevens als bijlage de volgende voorbeelden:

spot_img

Laatste intelligentie

spot_img