Home
Achtergrond
Second opinion via AI: digitale hulparts

second opinion AI digitale arts diagnose

Second opinion via AI: digitale hulparts

Marco den Teuling Marco den Teuling 6 april 2020

AI-systemen kunnen voor sommige medische aandoeningen al dienen als een serieus diagnosehulpmiddel. Google heeft nu een tool ontwikkeld voor het vergelijken van tumorscans. Artsen vragen zich af of je je gezondheid wel moet toevertrouwen aan zo’n systeem. We bekijken de huidige mogelijkheden en knelpunten.

Onderzoekers van het universitaire ziekenhuis van Hamburg-Eppendorf (UKE) hebben voor radiologie en specifiek voor het opsporen van kanker al een hele reeks systemen met artificiële intelligentie gecreëerd. De AI classificeert opnames van computertomografie (CT-scan) en magneetresonantie-tomografie (MRI-scan) even snel en geeft daarbij iedere menselijke arts het nakijken. De systemen kunnen tumoren in de longen en in de prostaat herkennen. Bij baarmoederhalskanker schat een AI in of de tumor al uitgezaaid is. Bij leverkanker geeft het systeem een prognose van de kansen bij bestraling. Ze worden echter hooguit als second opinion ingezet, de beslissing ligt altijd bij de arts, benadrukt prof. dr. Michael Forsting, medisch directeur van het instituut voor radiologie van UKE.

Er zijn bepaalde gebieden waarop AI de verantwoordelijke arts goed kan bijstaan, bijvoorbeeld bij het screenen van huidkanker. Het probleem is momenteel vooral het evalueren van de systemen, die al erg productief ingezet kunnen worden. Volgens oncoloog prof. dr. Michael Hallek van het academisch ziekenhuis is de AI-ondersteunde herkenning van tumoren bijna klaar voor gebruik in de praktijk. Het geautomatiseerd bepalen van de botleeftijd van jongeren aan de hand van een röntgenscan van de hand wordt al aangeboden als standaard hulpmiddel door de West-Duitse teleradiologievereniging.

Het Nederlandse Nico.lab, dat zijn oorsprong heeft in onderzoek aan het Amsterdams Universitair Medisch Centrum (UMC), heeft een AI-systeem ontwikkeld voor de diagnose en behandeling van beroertes. De software analyseert hersenscans om indicatoren voor beroertes te herkennen. Het systeem met de naam StrokeViewer is al op 3000 patiënten in Nederlandse ziekenhuizen getest. Volgens CEO Robert Kuipers van Nico.lab is een belangrijk voordeel van het AI-systeem de snelheidswinst. “Iedere minuut dat je een behandeling uitstelt, verliest een beroerte-patiënt bijna een gezonde maand in leven.” Kuipers geeft net als Forsting aan dat de software geen behandeladvies geeft, maar enkel visualiseert om de arts een beslissing te kunnen laten maken.

Tip!

Beveilig uw huis en blijf dreigingen een stap voor – met Foscam

Slimme IP-camera’s met live toezicht en haarscherpe beveiliging!

Meer informatie

Inzicht in de blackbox

Een probleem bij de systemen die classificeren is de kwaliteitscontrole. Artificiële intelligentie geeft weinig inzicht in hoe zijn beslissingen tot stand komen. Het neurale net dat eraan ten grondslag ligt is via deep-learning tot stand gekomen met behulp van honderden of duizenden voorbeelden, daarna nog verder verfijnd en getest. Maar waarop een specifiek antwoord of aanbeveling is gebaseerd, is niet na te gaan.

Volgens Forsting is dat in principe wel zo, maar zijn er twee oplossingen zijn voor dat probleem. De eerste is eenvoudigweg een parallelle controle uitvoeren. “Denk bijvoorbeeld aan longcontroles. In de toekomst zijn er waarschijnlijk niet genoeg artsen om alle controles uit te voeren. De beelden kunnen dan door een AI worden gecontroleerd, terwijl je foto’s mee laat nemen waarvan de juiste resultaten al bekend zijn.”

second opinion AI digitale arts diagnose longen longscan radiologie — <em>Een beeld van de immense datahoeveelheid bij radiologie. AI kan bijvoorbeeld helpen bij het herkennen van longtumoren. (Foto: Uniklinik Essen)</em>

De tweede mogelijkheid zijn AI-specifieke mechanismen voor plausibiliteitscontrole. Daarvoor kun je weer kijken naar het bepalen van de botleeftijd bij jongeren. Een radioloog bekijkt op een röntgenfoto de ontwikkeling van pols- en handwortelbeentjes. Als alle groeischijven al dichtgegroeid zijn, is de groei in principe voltooid. Op basis van de relatieve groottes kan op die manier de botleeftijd van jongeren worden bepaald (en bijvoorbeeld de toekomstige lengte).

Onder artsen geldt het bepalen van de botleeftijd als een erg tijdrovende taak en er zijn dan ook verschillende AI-systemen die dat geautomatiseerd kunnen doen op basis van bijvoorbeeld foto’s van handen of knieën. Dat geeft niet alleen een schatting van de botleeftijd als resultaat, maar ook een visuele indicatie van welke delen van de foto voor dat resultaat van belang waren. Als de AI daarbij belangrijke groeischijven helemaal niet heeft bekeken, bijvoorbeeld omdat iemand zijn hand had gedraaid, wordt dat door de grafische plausibiliteitscontrole meteen duidelijk.

“Er wordt momenteel veel onderzoek gedaan op dit gebied”, bevestigt prof. dr. Chistoph Palm van de Oost-Beierse technische hogeschool van Regensburg. Palm ontwikkelt met zijn team een AI die aan de hand van de videobeelden van een endoscopie slokdarmkanker kan herkennen. Ook dat systeem moet, als het uitontwikkeld is, visueel markeren welke beeldelementen in grote mate hebben bijgedragen aan de beoordeling.

Omgekeerde AI

Om te begrijpen hoe de processen in de blackbox gevisualiseerd kunnen worden, moet je voor ogen houden hoe een AI in de vorm van een neuraal netwerk wordt getraind. De training bestaat uit het laag voor laag aanpassen van de gewichten van knooppunten in het netwerk en het beoordelen van de resultaten van dat nieuwe netwerk. Alleen de aanpassingen die de grootste verbeteringen opleveren, worden door het algoritme bewaard. Dat proces wordt herhaald totdat het neurale netwerk zo optimaal mogelijk presteert.

Het ontwikkelen van een ‘explainable AI’, oftewel een AI die in de beeldanalyse zijn beoordeling toelicht, volgt de omgekeerde route in het neurale netwerk. Een algoritme past de ingangsparameters laag voor laag aan en bekijkt of het diagnostische resultaat bij de output daardoor wijzigt. Als op die manier de onderste laag bereikt is, wordt automatisch een analyse uitgevoerd van het invoerbeeld. De beslissende pixels zijn daarmee geïdentificeerd. De AI kan zo aan de arts laten zien welke delen van het beeld de beslissende invoer bevatten voor het resultaat.

Controle en peer-review

Palm waarschuwt echter dat het markeren van beeldelementen die belangrijk waren voor de beoordeling op zichzelf niet genoeg is voor een kwaliteitscontrole. Als voorbeeld noemt hij een eenvoudige AI die heeft geleerd een C te onderscheiden van een O. Het beslissende deel van het beeld om een C te herkennen is het open deel van de letter. De AI zal voor een plausibiliteitscontrole dus keurig het open deel markeren. Maar in dat deel van het beeld is helemaal niets te zien. Wat gebeurt er bij een oncologische AI die een tumor meldt, maar daarbij een deel van het beeld markeert waarop niets te zien is? Misschien is de beoordeling verkeerd, maar wellicht heeft de AI een samenhang gevonden die tot dusver nog niet bekend was.

second opinion AI digitale arts diagnose witlichtopname endoscopie — <em>Aan de hand van witlichtopnamen met hoge resolutie kan een AI al tijdens een endoscopie helpen om kanker vroegtijdig op te sporen. (Foto: OTH Regensburg)</em>

Dat soort elementaire vragen wetenschappelijk beantwoorden is een taak voor AI-onderzoek. Maar die wordt tegengewerkt door de enorm snelle ontwikkelingen op dat gebied. Het aantal wetenschappelijke publicaties wereldwijd over AI stijgt snel, experts hebben het over een jaarlijkse verdubbeling. Daarbij publiceren AI-onderzoekers steeds vaker zonder peer-review, dus zonder dat er een wetenschappelijke discussie is geweest over de publicatie. Men lijkt daarvoor simpelweg niet de tijd te nemen.

Wie wacht totdat een serieus blad met peer-review een artikel publiceert, moet meerdere maanden geduld hebben. In de tussentijd kan een ander onderzoeksteam al met de eer gaan strijken door hun resultaten ergens anders te publiceren zonder controle. Volgens prof. dr. Gerd Antes bestaat zeker bij AI het gevaar van een toenemende hoeveelheid ‘fake science’. Het peer-review-proces zou binnen dat vakgebied daardoor buitenspel gezet kunnen worden.

Overfitting en correlatie

Een ander punt van kritiek is het mantra dat big data en zo veel mogelijk datasets voor meer nauwkeurigheid van de daarmee getrainde AI zorgen. Is meer wel echt beter? Antes waarschuwt dat “het er uiteindelijk toe kan leiden dat je alleen meer hooibergen hebt om de spreekwoordelijke naald in te vinden”.

Niemand weet in de praktijk wat nu precies de optimale grootte van de dataset is om een bepaalde AI te trainen. Onderzoekers zijn het er alleen over eens dat bij een te kleine hoeveelheid data het risico van ‘overfitting’ bestaat. Het systeem werkt dan heel goed voor de trainingsdata, maar kan niet generaliseren. De AI moet echter ook goed werken bij data die het nog niet eerder heeft gezien. Daarom is voor een neuraal netwerk een voldoende grote set trainingsdata nodig en daarvan onafhankelijke testgegevens. Of er ook een bovengrens is, is niet bekend.

Er zijn dan ook altijd weer blunders van medische AI-systemen die aan het licht komen. Zo oordeelde een AI in een onderzoekslab van Microsoft dat astma goede bescherming biedt tegen een dodelijke vorm van longontsteking. Astma als bevorderlijke factor voor de gezondheid? Alleen door kritisch naar de data te kijken werd de samenhang duidelijk: astmapatiënten bezoeken vaker een longarts, zodat een ontsteking sneller wordt gedetecteerd. Het is een goed voorbeeld van het verschil tussen causaliteit en correlatie en van de vergissingen die een te snel gepubliceerde AI-toepassing kan maken. Wat we moeten denken van AI-systemen die bijvoorbeeld langetermijnprognoses doen over iemands leeftijdsverwachting, is uiteindelijk ook een individuele keuze.

AI en privacy

Ondertussen heeft ook Google het onderwerp AI-diagnosesystemen ontdekt. In juli publiceerde de Britse Google-dochter DeepMind een studie over een AI-systeem dat bij kwetsbare ziekenhuispatiënten een acuut nierfalen tot 48 uur van tevoren kan voorspellen. Het is getraind met medische gegevens van 700.000 Amerikaanse veteranen. In de praktijk herkende het systeem echter maar 56 procent van de daadwerkelijk opgetreden voorvallen en voor elke goede voorspelling waren er twee valse alarmen. Dat is dan al met al geen echt goede reclame voor AI-systemen.

DeepMind kwam ook in 2016 in de schijnwerpers door een samenwerking met de Britse ziekenhuisbeheerder Royal Free NHS Foundation Trust. Door die samenwerking kreeg DeepMind toegang tot nationale patiëntenbestanden, waarbij weinig garanties waren gegeven qua privacybescherming. Wel werd beloofd dat de data na afloop van de samenwerking verwijderd zouden worden. Door de hardware-eisen bij AI en het makkelijk kunnen inzetten in ziekenhuizen wordt vaak echter wel gebruikgemaakt van cloudoplossingen zoals het Google Cloud Platform. Ook het eerder genoemde StrokeViewer maakt daar gebruik van.

Het Nederlandse TNO en Integraal Kankercentrum Nederland (IKNL) werken samen aan AI-oplossing voor de zorg waarbij privacy vooropstaat. Dankzij Secure Multiparty Computation (MPC) blijft de gedeelde data versleuteld, zodat de betrokken partijen elkaars data niet kunnen inzien. De resultaten moeten ook als opensource beschikbaar komen, zodat de software breed inzetbaar is. Het doel is onder meer AI-algoritmes te ontwikkelen om het aantal patiënten met kanker te verminderen, meer patiënten te genezen en hun levensverwachting te verbeteren.

Ziekenhuisgegevens naar Google

Het databedrijf MRDM verwerkt de medische gegevens voor talloze grote ziekenhuizen in Nederland. Dat bedrijf koos er eerder dit jaar voor om daarbij gebruik te maken van de cloud van Google. Men gaf aan dat te hebben gedaan vanwege de veiligheid en capaciteit. Ziekenhuizen zijn daar wel van op de hoogte gesteld, maar patiënten niet.

Volgens de AVG moeten de data eigenlijk binnen de EU blijven, zodat ze onder de Europese wetgeving vallen. Als data bij Google op servers buiten Europa zou belanden, zou het bedrijf die data bijvoorbeeld moeten verstrekken als de lokale autoriteiten daarom zouden vragen. Bij AI-oplossingen voor de medische wereld en daarbuiten wordt vaak gebruikgemaakt van internationale cloudaanbieders. Encryptie van gegevens kan het risico op oneigenlijke toegang daarbij beperken.

second opinion AI digitale arts diagnose Amazon

Bedrijven als Google, Amazon, Apple en Microsoft vergaren dat soort data graag om AI-oplossingen aan te kunnen bieden. Denk bijvoorbeeld aan het ECG (elektrocardiogram) op de Apple Watch en speciale producten zoals Amazon Comprehend Medical. Die laatstgenoemde dienst kan uit ongestructureerde gegevens zoals artsenverslagen, klinische testrapporten en patiëntendossiers relevante medische informatie destilleren. Door wetgeving wordt het voor de bedrijven moeilijker om dat soort gegevens te verzamelen. In de VS begeven die bedrijven zich dan ook al zelf op het gebied van zorgverlening door bijvoorbeeld (online) drogisterijen over te nemen en allerlei gezondheidsdiensten aan te bieden.

Zoeken met SMILY

Google heeft met zijn deskundigheid op het gebied van beeldherkenning in augustus een AI-systeem uitgebracht dat bij foto’s van weefsel met mogelijke tumoren zoekt naar vergelijkbare beelden in de Cancer Genome Atlas. In dat project van de Amerikaanse overheid zijn verschijningsvormen van kanker gecategoriseerd. Een bijzondere uitdaging voor de nieuwe Google-zoekfunctie SMILY (Similar Medical Images Like Yours) is daarbij dat pathologen de metadata van gemaakte opnames op uiteenlopende manieren bijhouden en daarbij slechts zelden ingaan op specifieke relevante beeldelementen. Bovendien gaat het bij de beeldbestanden doorgaans om grote opnames met meer dan 100.000 × 100.000 pixels. Artsen met een vraag kunnen bij SMILY belangrijke delen van de scan markeren om daarmee gerichter te zoeken.

second opinion AI digitale arts diagnose Google SMILY weefsel scan — <em>Het SMILY-systeem zoekt bij een weefselscan (links) vergelijkbare opnamen, gesorteerd volgens de Gleason-score die het risico bij tumoren categoriseert. (Afbeelding: Google)</em>

De inbreng van de arts blijft een belangrijke voorwaarde voor het gebruik van SMILY, dat betoogt zelfs Googles onderzoeksteam rondom Martin Stumpe in Mountain View (Californië). Zoekresultaten op basis van testopnames van prostaatweefsel bevatten bijvoorbeeld slechts in 63,9 procent van de gevallen opnames met soortgelijk weefsel. Blind vertrouwen is absoluut misplaatst. Toch hopen veel medische professionals dat die technologie in de toekomst goede ondersteuningstools kan bieden.

AI-voordelen

De AI-ontwikkeling gaat ondertussen door. Bijvoorbeeld in Essen, waar bij MRI-scans is gebleken dat de AI ook beelden met minder contrast betrouwbaar kan beoordelen. Daardoor kan het aantal opnames verminderd worden. Een knie-onderzoek duurt dan nog maar 5 minuten in plaats van 15 minuten. Bovendien hebben de onderzoekers aangegeven dat door het beoordelen met AI het gebruik van contrastvloeistof bij gehooropnames met MRI achterwege kan blijven. Bij röntgenonderzoek kan de inzet van contrastvloeistof drastisch worden beperkt tot een tiende.

Niet alleen bij radiologie en tumoronderzoek belooft AI snelle vorderingen. Andere projecten zijn bijvoorbeeld gericht op behandelingen bij beroertes (StrokeViewer) of valpreventie in het ziekenhuis. Als een ziekenhuispatiënt ten val komt, heeft dat vaak grote gevolgen. Een AI kan de risicofactoren voor vallen bepalen en het gevaar inschatten voor individuele patiënten.

In plaats van heel specifiek, kan AI ook meer algemene toepassingsmogelijkheden bieden. Het Leuvense bedrijf LynxCare biedt AI-oplossingen om de enorme hoeveelheid patiëntengegevens die ziekenhuizen hebben, te structureren en visualiseren.

Volgens Forsting zijn er nog veel mogelijkheden voor nieuwe AI-toepassingen, van pathologie tot psychiatrie. Waarschijnlijk zou een psychiatrische AI iets kunnen afleiden uit de foto’s die een patiënt uploadt naar Instagram of de berichten die deze persoon op Facebook publiceert.

Gegevens digitaliseren

Een voorwaarde voor AI-diagnoses is het voortdurend digitaliseren van patiëntgegevens en het op elkaar afstemmen van dataformaten binnen het ziekenhuis. Dat zorgt niet alleen voor meer toepassingsmogelijkheden voor AI. Volgens Forsting wordt daardoor ook de individuele gezondheidszorg bevorderd, waarbij AI-systemen allerlei verschillende factoren met genetische en moleculairbiologische oorzaken analyseren. Volgens hem zullen artsen in de toekomst zelfs zonder meer aangewezen zijn op voorsortering en ondersteuning door AI.

Het ondersteunen van diagnoses met artificiële intelligentie biedt kansen voor geneeskunde op afstand. Bij kleinere ziekenhuizen moeten soms afdelingen gesloten worden of wordt hun voortbestaan helemaal bedreigd. Uit onderzoek over 2018 blijkt dat 11 van de 64 Nederlandse ziekenhuizen het financieel moeilijk hebben. Over dezelfde periode eindigde een op de vier Vlaamse ziekenhuizen met rode cijfers. Zeker bij regionale ziekenhuizen is het sluiten van afdelingen een reëel gevaar.

Telegeneeskunde kan daarbij uitkomst bieden. In de woorden van Forster is “Telegeneeskunde 2.0 geïntegreerde diagnostiek, ondersteund door AI”. Het bepalen van de botleeftijd van jongeren laat zien welke vorm dat kan aannemen. Bovendien kunnen meerdere AI-systemen tegelijk worden gebruikt als uitbreiding van elkaars diagnose.

Bij dergelijke systemen spelen echter niet alleen technische kwestie een rol, maar ook maatschappelijke ontwikkelingen. Behalve het AI-onderzoek moet ook het vertrouwen in die technologie groeien. Dat geldt ook voor de bereidheid van artsen om de techniek in te zetten.

(Arne Grävemeyer en Marco den Teuling, c’t magazine)

Wat is er waar van IT-mythes?

Maakt AI de kwantumcomputer overbodig?
Gaten in veiligheid messengers
Docker-containers automatisch updaten
Verschillen in front-ends

Bestel nu

Tip

Waarom NIS2 je dwingt anders naar cybersecurity te kijken

Download het e-book en krijg direct inzicht in de stappen die jouw organisatie moet zetten.

Download nu

Marco den Teuling

Had als eerste computer ooit een 16-bit systeem, waar van de 48 kilobyte toch echt niet ‘genoeg voor iedereen’ was. Heeft een brede interesse in tech en IT, van nieuwe hardware tot obscure softwaretools. Vindt ‘Software as a Service’ een onbedoeld ironische naamgeving.