big-data_1

Het geloof in big data is sterk. Het verzamelen, opslaan en analyseren van informatie maakt ons leven makkelijker, bedrijven winstgevender en de overheid efficiënter. Maar het kan ook de blik vertroebelen, weten Marcel Thaens en Jorinde Nuytinck. 

In het nieuwste boek Homo Deus van de Israëlische bestsellerauteur Yuval Noah Harari speelt dataïsme een belangrijke rol. Harari ziet ons blind vertrouwen in grote hoeveelheden digitale informatie (big data) als een nieuw geloof waarin alleen informatie van echte waarde is.

De rol van data

Dat big data zo’n belangrijke rol zijn gaan spelen, danken we aan een razendsnelle technologische ontwikkeling die het verzamelen, opslaan en analyseren van grote hoeveelheden gegevens mogelijk maakt. Neem bijvoorbeeld dna-onderzoek. Toen wetenschappers voor het eerst het menselijk genoom in kaart brachten, kostte dat dertien jaar en drie miljard dollar. Tegenwoordig kan iedereen het binnen enkele weken voor minder dan duizend dollar laten doen. De verzamelde databergen genereren nieuwe inzichten, maar een zinvolle interpretatie blijkt vaak nog lastig.

Bij de overheid verspreidt het geloof in big data zich als een epidemie. Verschillende overheidsdiensten, bijvoorbeeld de Belastingdienst, het uwv, de politie en de veiligheidsdiensten verzamelen allerlei digitale gegevens over burgers.

Illusie van objectiviteit

Marcel Thaens, bijzonder hoogleraar bestuurskunde aan de Erasmus Universiteit en consultant bij adviesbureau pblq, bestudeert het fenomeen. Hoewel Thaens de voordelen van big data ziet, maakt hij zich ook zorgen. ‘Data hebben een zweem van objectiviteit en hardheid,’ zegt Thaens. ‘Maar dat klopt niet altijd. Neem bijvoorbeeld een systeem dat rechters in de VS helpt om de kans op recidive van gedetineerden te berekenen. Het is een bekend probleem dat er een vertekening in die algoritmen zit die de arme, zwarte man benadeelt.’ Waar dit probleem ontstaat, is onbekend. De bedrijven die in opdracht van de overheid algoritmen maken, geven geen inzicht in hoe hun berekeningen werken.

Blind geloof in data kan volgens Thaens ook resulteren in symptoombestrijding. ‘Neem predictive policing,’ legt hij uit. ‘Aan de hand van big data kun je voorspellen in welke straten de meeste inbraken plaatsvinden. Daar kun je extra patrouilleren. Met als risico dat de inbraken zich verplaatsen. De waaromvraag wordt niet meer gesteld. Het helpt bij het omhoog brengen van de oplossingspercentages, maar lost de fundamentele problemen niet op.’

Misinterpretaties

Big data hebben ook het vakgebied van Jorinde Nuytinck compleet op z’n kop gezet. Nuytinck werkt als taxonoom bij Naturalis Biodiversity Center. Ze bestudeert schimmels en beschrijft nieuwe soorten. Dat is geen sinecure, want schimmels bestaan voornamelijk uit kleine, nauwelijks van elkaar te onderscheiden draden onder de grond. In een gram grond zit al snel een half miljoen bacteriën en schimmels van tienduizenden verschillende soorten. ‘Er zijn naar schatting vijf miljoen soorten fungi,’ zegt Nuytinck. ‘Hiervan zijn er maar 100.000 beschreven.’ Ter vergelijking: van de ongeveer 350.000 plantensoorten zijn er al 300.000 beschreven.

Onderzoek naar schimmels is met de opkomst van zogenaamde next generation sequencing technieken veel makkelijker geworden. Deze snelle en goedkope manier van dna-onderzoek maakt het bestuderen van de duizelingwekkende diversiteit aan schimmels voor het eerst mogelijk. Hierbij wordt gekeken naar specifieke stukjes dna en de overeenkomst hierin. In studies die gebruik maken van deze techniek, wordt het begrip ‘soort’ ingeruild voor ‘otu’ (operational taxonomic unit). Dat terwijl een soort een rijk begrip is. Een soortbeschrijving bevat informatie over de morfologie van een organisme, de verspreiding en de ecologische niche. Kun je een exemplaar op soort brengen, dan maakt dat vergelijken met andere studies, waarin dezelfde soort gevonden is, mogelijk.

‘Dat is met otu’s niet zo,’ zegt Nuytinck. ‘Je kunt ze wel binnen een studie vergelijken en bijvoorbeeld kijken of dezelfde voorkomt beneden en bovenaan een berg. Vergelijk je met andere studies, dan ontstaan er misinterpretaties. Twee soorten die tot dezelfde otu worden gerekend, kunnen totaal verschillend zijn. Het kan het verschil zijn tussen een schimmel die in symbiose met een plant leeft en een schimmel die dood materiaal afbreekt,’ vertelt Nuytinck. ‘Daarmee zit je er met conclusies over de rol in het ecosysteem helemaal naast.’

Aanpassen aan data

Het werk van taxonomen zal voorgoed veranderen door de opkomst van big data. Nuytinck ziet dna-technieken als een uitbreiding van de gereedschapskist van de taxonoom van de toekomst. Tenminste, als haar vakgebied deze fase overleeft. ‘Het is bijna onmogelijk om nog onderzoeksgeld te krijgen voor taxonomisch onderzoek,’ stelt Nuytinck. ‘Alles moet nieuw en innovatief zijn.’ Haar eeuwenoude vakgebied is dat in de ogen van subsidieverstrekkers overduidelijk niet. Het is nu vooral een hobby van gepensioneerde vrijwilligers. Nuytinck hoopt dat biologen op tijd inzien dat taxonomie juist kan helpen om dna-data zinnig te interpreteren. ‘Als je de klassieke soortbeschrijving uitbreidt met een dna-code, dan kan iedereen putten uit kennis over soorten die in de afgelopen tweehonderd jaar is opgebouwd.’

Thaens voorziet dat ook de manier waarop ambtenaren werken zal veranderen door de integratie van big data in hun werk. ‘Big data worden nu nog als extraatje gezien, maar organisaties zouden eigenlijk datagedreven moeten worden,’ vindt Thaens. ‘Uit analyse van big data blijkt bijvoorbeeld dat niet ouderen, maar eenoudergezinnen het grootste risico op brand geven. Terwijl ouders koken, doen hun kinderen allerlei dingen buiten hun blikveld. Wijken waar meer eenoudergezinnen wonen hebben dan ook een hoger risico op branden. Dit zou kunnen betekenen dat de brandweerkazernes moeten worden verplaatst. Misschien is de brandweer van de toekomst niet iemand die branden blust, maar branden voorkomt. Dat kan een heel ander type mens zijn.’

Harari schetst in Homo Deus een gitzwarte toekomst waarin het blinde geloof in data tot het einde van de mensheid leidt. Vooralsnog hopen Thaens en Nuytinck dat de mens zich kan aanpassen.

Digitale gluurders: donderdag 19.20-19.55 op NPO2 bij de Kennis van Nu! 

Ontdek meer in de special