South by South West is hét technologie-event van Amerika. Tienduizenden vernieuwers komen jaarlijks in Austin Texas bij elkaar om nieuwe mogelijkheden te onderzoeken, maar ook kritisch te bekijken. Kunstmatige Intelligentie (AI) was een belangrijk onderwerp in Austin. Deze sessie over AI in de gezondheidszorg sprong er uit.
Tijdens de sessie Beating the Hype of AI in healthcare kwamen twee uitstekende en nuchtere verhalen aan de orde over hoe Kunstmatige Intelligentie (AI) in de gezondheidszorg wordt toegepast. De Nederlander Michael Abramoff, werkzaam in Iowa, vertelde over geautomatiseerde diagnose van oogziekten (diabetische retinopathie), en Elisabeth Asai over datzelfde bij huidziekten. In beide gevallen gaat het om ‘assistive AI’: de computer helpt de mens door een snelle en nauwkeurige diagnose te stellen. Het doel hiervan is betere toegang tot zorg (een einde aan de wachtlijsten) en lagere kosten.
Geen disruptie maar evolutie
Opvallend bij de twee cases was dat beide wetenschappers al decennialang bezig zijn met automatisering bij diagnose. AI is dus geen revolutie maar een evolutie. In de jaren 80 met regel-gebaseerde systemen waarbij de computer vragen stelde. Daarna met eenvoudige convolutionele netwerken, maar dat werkte nog niet goed, omdat ze alleen maar konden werken met kleine foto’s (16×16 pixels) waardoor de diagnoses erg onnauwkeurig waren. En de algoritmes waren kwetsbaar: door kleine verstoringen werkte het al niet meer. Moderne AI heeft betere algoritmes en er is heel veel meer computerkracht, waardoor er nu kan worden gewerkt met goede en scherpe foto’s.
FDA goedkeuring
De oogdiagnose-tool van Abramoff is bijzonder, want goedgekeurd door de FDA (de Food and Drug Administration). Dat vereiste een langdurig proces, waarbij de kenmerken van het algoritme moesten worden ‘gematcht’ met de eisen van de FDA Trials:
- Gevoeligheid: hoeveel gevallen vangt je systeem
- Specificiteit: hoe weinig vals-positieven vangt je systeem
- Diagnosticeerbaarheid: het moet werken op de overgrote meerderheid van alle gevallen
Daarnaast zijn er bij de FDA veel eisen over de manier van werken en dient het AI-systeem ook juridisch verantwoordelijk te zijn voor de diagnose.
Toen een vraag uit het publiek kwam wat Abramoff vond van de resultaten van Google, die met deep learning allerlei kenmerken (zoals geslacht) uit oogfoto’s kan halen, zei hij simpelweg: zij zijn niet FDA goedgekeurd, en meer kan ik daar niet over zeggen. Met andere woorden: daar hangt al dat gewicht niet aan.
Beiden legden ook goed uit hoe hun algoritmes in elkaar zaten, met deep learning worden biomarkers herkend en anomalieën gevonden.
Nauwkeurigheid
De nauwkeurigheid van dergelijk diagnose-systemen is niet altijd goed te vergelijken met de diagnose door menselijke artsen, omdat daar heel veel ‘ruis’ in zit. Zelfs artsen uit verschillende landen scoren totaal anders met hun diagnosenauwkeurigheid. Er wordt daarom alleen gekeken naar de feitelijke uitkomst en daaruit blijkt dat deze systemen zeker niet slechter scoren dan de diagnoses van artsen.
En ook tijdens deze sessie kwam aan de orde of de AI en de algoritmes ‘bias’ hebben of discrimineren. En dat is ook hier het geval. De diagnose van huidziekten bij een donkere huid blijkt namelijk een stuk lastiger te automatiseren dan bij een blanke huid.
Beperkte toepassingen
En beiden maakten heel duidelijk waar AI momenteel goed werkt: op een klein, heel goed gedefinieerd onderdeel kan AI heel behulpzaam zijn met snelle, goedkope, schaalbare en goede diagnose. Het beeld van de robot dokter die binnen een paar jaar alle medische banen overneemt is volslagen onzinnig.
Lessen
In deze sessie op SxSW zat een aantal interessante lessen die ook buiten het terrein van de medische wetenschap bruikbaar zijn.
- Het succesvol automatiseren van ingewikkelde processen (zoals de diagnose van huid- of oogziekten) met behulp van AI en algoritmen is in de praktijk altijd een lang en ingewikkeld proces. Verwacht niet opeens alle heil en zegen van data in combinatie met AI en denk ook niet dat er opeens revolutionaire dingen gebeuren als je een bak ruwe data door de AI-molen gaat halen. Maar goed afgebakende processen, met duidelijke criteria en ‘business rules’, waar al langere tijd kleine stappen worden gezet op weg naar automatisering of optimalisering, kunnen met behulp van AI versneld worden. Maar het gaat in duizend kleine stapjes.
- In het verlengde van het voorgaande: De impact van technologie op de korte termijn wordt vaak overschat, maar die op de de lange termijn wordt dikwijls onderschat. Dit wordt ook wel de wet van Amara genoemd en deze geldt zeker voor de ontwikkelingen rond kunstmatige intelligentie. Wat we daarvan kunnen leren in de sport? Experimenteer met duidelijk afgebakende processen, waar het gebruik van data en algoritmes een probleem zou kunnen oplossen of de efficiëntie zou kunnen verhogen. Bijvoorbeeld bij projecten die lopen om het indelen van competities te automatiseren, waarbij het belangrijk is dat de krachtsverhoudingen tussen teams niet te groot zijn. Maar verwacht geen wonderen.
Meer weten over de Lessen van SXSW?