Tegenwoordig worden bijna alle gegevens tot in lengte van dagen bewaard. Elke seconde komen er nieuwe gegevens bij. Bedrijven die er hun werk van maken om data te verzamelen hebben databases die zo snel groeien dat het een uitdaging is om deze gegevens nog te beheren en te analyseren. We hebben het dan over ‘Big Data’. Het eerste waar we bij Big Data aan denken is privacy. Big-data-bedrijven weten alles van ons en vaak verkopen ze ons ‘leven’ ook nog eens door aan anderen. En dan heb je ook nog nationale veiligheidsdiensten als de NSA die alle ruimte krijgen om in onze gegevens rond te neuzen. Maar Big Data is echt niet alleen maar kommer en kwel. Integendeel, we kunnen er ontzettend spannende dingen mee! Ook de zorg gaat door Big Data ingrijpend veranderen, die beweging is al even geleden in gang gezet.
Wat is Big Data?
De officiële definitie van Big Data is nogal saai en vaag. Ik zou zeggen, lees die vooral na op Wikipedia. Voor de leesbaarheid van dit artikel houd ik het lekker simpel. Big Data is een gigantische berg verzamelde gegevens. Deze gegevens kunnen werkelijk alles zijn, dat is afhankelijk van waar de interesse van de verzamelaar ligt. Deze gegevensberg blijft bovendien snel doorgroeien. Wat is snel? Nou, neem bijvoorbeeld de Large Hadron Collider, de deeltjesversneller in Genève. Deze doet ongeveer 40 miljoen nieuwe metingen per seconde! Met zulke aantallen is het bestuderen van de gegevens natuurlijk geen mensenwerk meer. De analyse van Big Data is een taak die we dan ook met liefde aan computers uitbesteden.
Wat kunnen we ermee?
In deze blog kijken we vooral naar de zorgtoepassingen van Big Data. Dit is echter maar een klein stukje van de taart. Big Data wordt op veel meer terreinen gebruikt en bewust of onbewust, in ons dagelijks leven worden we er allemaal mee geconfronteerd. Zo gebruikt Google zijn Big Data van persoonsgegevens om ons zo relevant mogelijke advertenties te tonen. Hoe gerichter de advertentie, hoe meer geld ze er voor kunnen vragen. Amerikaanse politieke partijen gebruiken demografische Big Data om zo efficiënt mogelijk campagne te voeren. Maar ook om de grenzen van de kiesdistricten in hun voordeel te bepalen (het omstreden ‘gerrymandering’). En dan is er ook nog een mooi voorbeeld van hoe je als particulier zelf met Big Data aan de slag kunt. De website ‘IBM Chef Watson’ gebruikt zijn Big Data van recepten en ingrediënten om ons te helpen in de keuken. Heeft u nog een halve komkommer en stuk gember in de koelkast liggen? Dan kan Chef Watson u adviseren welke smaken daar goed bij combineren.
Privacy
Voordat we kijken naar de winst die met Big Data in de zorg kan worden geboekt staan we even stil bij het voornaamste obstakel. Want privacy, dat is wel een dingetje. Welke gegevens worden er allemaal over ons verzameld, en wat mag de verzamelaar wel en niet met onze gegevens doen? Zorgen over de privacy kunnen een barrière vormen voor de acceptatie van oplossingen die Big Data gebruiken. Dit geldt in de zorg misschien nog wel meer dan elders, omdat de Big Data daar vaak is samengesteld uit patiëntgegevens.
Big Data is vooral het werkterrein van grote IT-bedrijven als Microsoft, Google en Facebook. Dat zal wel zo blijven, want de verwerking van zoveel gegevens gaat niet zonder een enorme hoeveel hoeveelheid kennis en middelen (zoals opslagcapaciteit, bandbreedte en rekenkracht). Het beschermen van onze persoonlijke belangen is natuurlijk niet de eerste prioriteit van deze commerciële partijen. Maar ze bepalen wel voor een belangrijk deel de spelregels. Natuurlijk, ze hebben zich te te houden aan privacywetgeving, maar om hun diensten te mogen gebruiken moeten we wel instemmen met privacyvoorwaarden die deze bedrijven zelf hebben bedacht. Er is vrijwel niemand die deze voorwaarden ook echt leest en dan worden ze ook nog eens met regelmaat gewijzigd. Hebben we wel de garantie dat ze de gegevens die ze van ons verzamelen niet doorverkopen aan adverteerders of zorgverzekeraars? En dan zijn er ook nog nieuwsgierige overheden, Big Brother loves Big Data. Eerder bleek al dat dat geen van de bekende technologiereuzen er moeite mee had om de Amerikaanse veiligheidsdienst NSA toegang tot hun big data te verlenen.
Kortom, privacy is een terechte zorg die aanbieders van oplossingen zullen moeten wegnemen. Dit kan door Big Data in eigen beheer te nemen, maar de vraag is of dan de beveiliging en beschikbaarheid kunnen worden gegarandeerd. Het alternatief is waterdichte afspraken maken met de beherende partij maken over o.a. privacy, de versleuteling van data, het anonimiseren van gegevens en de fysieke locatie van de servers (i.v.m. lokale wetgeving).
Big Data in de Zorg
Goed, we weten nu wat Big Data is, wat je er mee kunt en waar we voor moeten oppassen. Maar hoe zit het met de zorg? Welke toepassingen van Big Data kunnen de zorg vooruit helpen? Of misschien zelfs levens redden?
Het is misschien niet zo bekend, maar Big Data wordt al op verschillende gebieden in de zorg toegepast. Dat hoeft overigens niet te betekenen dat we er ook al de vruchten van plukken. De eerste fase van Big Data is namelijk zoveel mogelijk data verzamelen, en dat kost tijd. Afhankelijk van de toepassing kunnen hier soms wel decennia overheen gaan. Een flinke investering waar we op de korte termijn niets voor terug zien. Loont het dan wel om hier toch aan te beginnen? Laten we eens kijken naar de (toekomstige) waarde van Big Data voor de zorg aan de hand van drie bestaande projecten.
1. Google Flu Trends
Als er één bedrijf is dat veel data over ons heeft verzamelt dan is het Google wel. Elke keer dat we een zoekopdracht doen leert Google iets nieuws over ons. Dat is vaak dus. En wist u dat 1 van de 20 Google-zoekopdrachten zorggerelateerd zijn? “Daar kunnen we wat mee”, moet Google gedacht hebben toen ze in 2008 Google Flu Trends lanceerden. GFT is een voorbeeld van hoe we bestaande data voor nieuwe doeleinden kunnen gebruiken en tegelijk een goed voorbeeld van wat er mis kan gaan wanneer we deze data verkeerd ‘begrijpen’.
Het idee achter Flu Trends? Mensen met met griepverschijnselen gaan op internet zoeken naar informatie hierover. Door zoekopdrachten te filteren en te koppelen aan geografische locatie zou het voor Google mogelijk zijn om grieptrends te signaleren. Twee weken sneller dan traditionele methodes en met een hogere nauwkeurigheid. Althans, dat was de gedachte, want in 2013 zat Google Flu Trends er met zijn voorspelling hopeloos naast. Google voorspelde 2x zoveel doktersbezoeken dan er daadwerkelijk plaatsvonden. Waar ging het mis? Lang niet iedereen die naar informatie over griep zocht bleek ook daadwerkelijk griep te hebben. Misschien hadden mensen gewoon over de griep gehoord en wilden ze er meer over lezen? Wat het ook was, Google bleek onvoldoende in staat om onderscheid te maken tussen mensen die ziek waren en mensen die alleen informatie zochten. Deze misser is voor Google de reden geweest om te stoppen met de publicatie van de zoektrends. Achter de schermen bestaat het project overigens nog wel. De data wordt nu rechtstreeks gedeeld met instellingen die onderzoek doen op het gebied van epidemiologie.
2. ERGO en Generation R
Wil je meer weten over een bepaalde ziekte, en hoe deze zich ontwikkelt, dan kun je data verzamelen van patiënten. Maar wat als je wilt leren hoe de ziekte ontstaat? En of een ziekte te voorkomen is? Dan moet je er met je onderzoek al bij zijn voordat iemand een patiënt wordt.
Dat is wat het Erasmus MC doet. Via twee bevolkingsonderzoeken verzamelt het universitaire ziekenhuis gezondheidsdata van zo’n 35,000 Rotterdammers. Dit zijn niet alleen patiënten maar vooral ook gezonde vrijwilligers. Zij hebben zich beschikbaar gesteld om zich eens in de zoveel tijd te laten onderzoeken (denk aan MRI, bloeddruk, bloedsuiker, DNA, darmflora, etc.).
Het eerste project, ERGO, loopt al sinds 1990 en heeft als scope alle inwoners van de wijk Ommoord van 40 jaar en ouder. Het doel van dit project is in kaart brengen hoe ouderdomsziektes ontstaan en zich verder ontwikkelen. In 2001 is hier het project Generation R bijgekomen, dat zich juist richt op de groei en ontwikkeling van kinderen. De deelnemende kinderen worden gemonitord vanaf de baarmoeder tot aan hun 18e levensjaar. Gedurende deze periode wordt er onder andere gekeken naar het ontstaan van ziekten en gedragsproblemen.
Het Erasmus MC heeft per deelnemer zo’n 5GB aan data verzameld waarin naar hartelust naar patronen en verbanden kan worden gezocht. Dat heeft al een hoop nieuwe kennis opgeleverd! We weten nu bijvoorbeeld de eerste geheugenproblemen al 14-15 jaar voor de diagnose alzheimer optreden. En dat kinderen die in hun eerste levensmaanden geen speelgoed hebben dat bij hun leeftijd past als peuter vaker emotionele problemen vertonen. En dat cannabisgebruik tijdens de zwangerschap samenhangt met een verminderde groei van de baby in de baarmoeder. En nog heel veel meer!
3. IBM Watson HealthHeeft u een veelvoorkomende ziekte dan stelt uw huisarts in een oogwenk zijn diagnose. Hij heeft het immers al honderd keer gezien. Maar wat als we iets heel erg zeldzaams oplopen? Dan wordt het lastiger, want zelfs de meeste arts heeft relatief gezien een klein referentiekader. Hij kan alleen terugvallen op zijn eigen ervaringen en de studies die hij heeft gelezen. En uw arts kan nog zo leergierig zijn, er wordt zoveel gepubliceerd dat wat hij leest niet meer dan een bladzijde uit een bibliotheek is. Voor de lastige gevallen kan uw arts dus wel wat hulp gebruiken.
Ook hier is Big Data de sleutel. In Duitsland krijgen specialisten sinds kort assistentie bij ingewikkelde gevallen van Watson, de supercomputer van IBM. De artsen vullen een uitgebreide vragenlijst in en Watson gaat met deze informatie spitten in de Big Data van verzamelde kennis over ziektes. In tegenstelling tot een arts is het voor Watson geen enkel probleem om hierbij miljoenen (geverifieerde) publicaties te raadplegen. Watson stelt op basis hiervan de meest waarschijnlijke diagnose voor en onderbouwt dit door te vermelden hoe hij tot deze diagnose is gekomen. Het is vervolgens nog wel aan de specialisten om de uitkomst te beoordelen.
Nu is de hulp van ‘dokter Watson’ nog voorbehouden aan een select groepje specialisten, maar hoe mooi zou het zijn als straks elke huisarts van de kracht van Big Data gebruik kan maken? Met de opkomst van slimme apparaten (zoals de digitale stethoscoop) lijkt dat slecht een kwestie van tijd. De honderdduizenden metingen die deze apparaten gezamenlijk doen kunnen straks in de Big Data worden opgenomen en met elkaar worden vergeleken. Zo kan straks iedere arts vergelijkbare gevallen of relevante studies vinden, volledig op maat.
Watson Health is overigens veel breder inzetbaar. De supercomputer wordt ook gebruikt voor medisch wetenschappelijk onderzoek. Watson doet dit door in de Big Data van gezondheidsgegevens te zoeken naar statistische verbanden (datamining). Een voorbeeld uit de praktijk van wat dit kan opleveren is het geneesmiddel Vioxx. Deze ontstekingsremmer is in 2004 van de markt gehaald nadat uit data-analyse van Watson bleek dat ernstige hartproblemen een veelvoorkomende bijwerking waren.
Even Bigger DataBig Data is niet iets waar we in ons dagelijks leven erg bij stil staan. Toch is de impact ervan op onze levens onmiskenbaar. Misschien bent u na het lezen van dit artikel wel verrast door wat we nu al allemaal met Big Data doen en kunnen. Dat is al best spannend. En we staan pas aan het begin. Het verzamelen van data gaat door, en in een rap groeiend tempo. De drijvende kracht voor de komende jaren is het Internet of Things. Steeds meer apparaten staan in directe verbinding met het Internet en verzenden constant nieuwe informatie over ons naar de cloud. Als we ons even tot de zorg beperken dan kun je hierbij denken aan sportkleding, horloges, thuismeters, pleisters en lenzen. Voorheen ‘domme’ dingen maar tegenwoordig kunnen ze voorzien worden van sensoren die onze gezondheid 24/7 monitoren. En natuurlijk wordt ook al deze informatie weer ergens opgeslagen en bewaard. Door van één persoon doorlopend gezondheidsinformatie te verzamelen heb je al snel een enorme berg data. Vermenigvuldig dat met de wereldbevolking en je hebt de Big Data van de toekomst.
Alle info over iedereen zal leiden tot meer kennis, nieuwe inzichten, zorgvuldigere prognoses en razendsnelle diagnoses. En toegegeven, een beetje eng klinkt het ook wel. De privacy zal altijd een punt van discussie blijven. En als Big Data onze artsen ondersteunt dan het is eenvoudig om te stellen dat de eindverantwoordelijkheid bij de specialist ligt, maar is dat niet eenvoudiger gezegd dan gedaan? Durft een arts straks nog wel het advies van de computer naast zich neer te leggen? Een computer die voor dat advies miljoenen publicaties heeft geraadpleegd? Is het niet beter om daarop te vertrouwen en wordt het niet aanlokkelijk om de eigen verantwoordelijkheid te ontlopen? Zoals journaliste Timandra Harkness het omschrijft: “Een algoritme is niemand verantwoording verschuldigd.“
Goed en leuk geschreven!