‘Datawetenschap en statistiek zijn beslist geen neutrale tools – ze stonden centraal in de rassenwetenschap’

Iris Clever | wetenschapshistoricus De moderne statistiek is geworteld in de rassenwetenschap. „We moeten goed beseffen waar de oorsprong van deze methodes ligt.”

Iris Clever op de campus van de universiteit van Chicago.

De moderne wereld draait op data en statistiek. In AI-chatbots, om wetenschappelijke resultaten te toetsen, om fraude te voorspellen. Keiharde cijfers ogen neutraal, bieden houvast in de complexe wereld en maken patronen herkenbaar. Maar waardevrij wiskundig gereedschap zijn ze absoluut niet, ziet wetenschapshistoricus Iris Clever. „We plaatsen zo veel vertrouwen in algoritmes en data, zonder écht te begrijpen wat voor menselijke keuzes en vooroordelen ze bevatten.”

Neem Karl Pearson (1857-1936), één van de voorvaderen van de moderne statistiek. Zijn bekendste uitvinding is de correlatiecoëfficient, ook wel Pearson’s r, waarmee verbanden tussen verschillende variabelen worden getoetst. Wat Clevers studenten aan de universiteit van Chicago steevast verbaast: „Pearson was een rassenwetenschapper. Hij had een enorme schedelcollectie, zo’n zevenduizend stuks, uit allerlei hoeken van de wereld. Veelal in koloniale context verzameld. Zijn ultieme doel was om die met de nieuwste statistische methoden op ras in te delen. En die methoden gebruiken wetenschappers nog altijd.”

Clever raakte Pearson op het spoor door haar fascinatie voor de medische en culturele geschiedenis van het lichaam. Die bleek sterk verbonden met het kolonialisme, ontdekte ze tijdens haar master geschiedenis in Utrecht en haar promotie in Los Angeles. Zo leerde ze over de Niasmaskers, gipsen afdrukken van de gezichten van inwoners van het Indonesische eiland Nias. Die zijn gemaakt door Nederlandse wetenschappers op koloniale expeditie, een deel hangt nu in het Rijksmuseum. „Ze vormen een bizarre momentopname van hoe die koloniale wetenschap in zijn werk ging. Ik wilde daar dolgraag meer over weten.”

Dus dook ze de archieven in, op zoek naar beschrijvingen van wetenschappelijke ontmoetingen tijdens de koloniale tijd. Helaas bleken de kolonisten daar weinig over te schrijven, zowel in wetenschappelijke publicaties als in dagboeken en brieven tussen rassenwetenschappers. Wat Clever wel vond: „Data, data en nog eens data. Dozen aan tabellen van lichaamsmetingen, tachtig pagina’s aan geouwehoer over statistiek.”

Was dat verbazingwekkend?

„Het was opvallend, maar ook wel logisch: de rassenwetenschap is per definitie een classificatieprobleem. Ze vergeleken schedelmetingen met elkaar om mensen in verschillende groepen op te delen. Dat was toentertijd, in de vroege twintigste eeuw, een heel gewoon idee. En om zulke vergelijkingen te maken, heb je heel veel data en nieuwe statistiek nodig. Dat is precies waar Pearson zijn Coefficiënt of Racial Likeness voor ontwikkelde: hij bracht allerlei schedelmetingen samen tot één getal.

„Een schedelmeting bestaat uit wel 32 verschillende gemeten afstanden die onderling van elkaar afhankelijk zijn, en Pearson vond dat zijn tijdgenoten daar slordig mee omgingen. Dus gaf hij de aanzet voor de multivariate statistiek, met als doel om ras het allerbeste te classificeren.”

Moeten we dan de moderne statistiek op de schop nemen?

„Dat ook weer niet. We hebben een heleboel te danken aan Pearsons statistiek, en ik zou niet zeggen dat de statistiek zelf racistisch is. Maar we moeten goed beseffen waar de oorsprong van deze methodes ligt. Ik wil af van het idee dat veel van mijn studenten hebben als ze mijn lokaal binnenlopen: dat statistiek per definitie een neutrale tool is. Het is niet bedacht door een nietsvermoedende wetenschapper en vervolgens door rassenwetenschappers gebruikt, het is specifiek voor raciale classificatie ontwikkeld. Dat lijkt me een interessant en belangrijk historisch gegeven.”

En hoe zit dat met data?

„Het verzamelen, publiceren en vooral goed bewaren van data stond centraal in de rassenwetenschap. Bij het classificeren van een schedel ben je gebaat bij een rijke verzameling data om je metingen mee te vergelijken, en elke nieuwe schedelmeting voegt iets toe aan die verzameling. Nu ja, elke nieuwe meting… schedels die er te vreemd uitzagen of buiten de bestaande groepen vielen, werden niet altijd in de collecties opgenomen. Zo bouwden rassenwetenschappers een kunstmatige homogeniteit in hun verzamelingen. Precies het idee achter rassenwetenschap, namelijk dat er sterk gedefinieerde rassen zijn, zit dan ingebouwd in de methodiek en de data.”

„En die ingebouwde, menselijke waarden kunnen gemakkelijk door tijd en ruimte reizen. Zelfs in de tijd van Pearson was het een kwestie van per post versturen en overschrijven. En hoe verder de data van hun oorsprong verwijderd raken, hoe sneller die oorsprong vergeten wordt. Dat werkt zelfs tegenwoordig nog door, bijvoorbeeld in forensische software als Fordisc, die ongeïdentificeerde lichamen met referentiedatabases vergelijkt om vermiste mensen op te sporen. Die databases zijn deels gebaseerd op de oude schedelcollecties van rassenwetenschappers, inclusief Pearsons collectie. De denkbeelden van een eeuw geleden beïnvloeden dus de conclusies van de software.”

Inmiddels is de wetenschappelijke consensus dat biologisch ras niet bestaat. Zijn we daarmee van het probleem van geracialiseerde data af?

„Helaas niet. Neem bijvoorbeeld mijn collega’s in medisch onderzoek, hier in Chicago. Ze trainen een algoritme om de ontwikkeling van tumoren te voorspellen, op basis van medische scans van het weefsel. Het werkt ongelofelijk goed, en het is dus allemaal gebaseerd op visuele data van patiënten. Maar hoewel ze juist géén data over ras bij de training van het model gebruiken, en dokters het ook niet uit de foto’s zouden kunnen aflezen, kan de machine ras met heel veel zekerheid voorspellen. Zonder dat ze erom vroegen, zonder dat ze het wilden, kan hun algoritme mensen op ras indelen.

„En ze wisten niet te achterhalen hoe het model dat precies doet. Vermoedelijk met een combinatie van allerlei losse eigenschappen van zo’n tumor, wat het buitengewoon moeilijk te isoleren maakt. Op zichzelf is de ‘rasvaardigheid’ in dit geval geen probleem, maar het laat zien dat zoiets ondanks de beste bedoelingen en maatregelen toch in een model kan opduiken. En dat brengt risico’s met zich mee. Zo’n model zou die rasvaardigheid kunnen gebruiken om verschillende groepen mensen ongelijk te behandelen. Bijvoorbeeld het voorschrijven van meer medische middelen naar witte patiënten, hogere verzekeringspremies voor niet-witte patiënten, of minder niet-witte patiënten doorverwijzen voor follow-upscreenings.”

Terwijl de onderzoekers in dit geval alles op alles hebben gezet om etniciteit níét mee te nemen in de training van het model.

„Precies. Goede bedoelingen zijn mooi en vreselijk belangrijk, maar niet genoeg om het probleem op te lossen. Wiskundige Cathy O’Neil beschrijft het treffend in haar boek Weapons of Math Destruction: ‘Grote dataprocessen vinden niet de toekomst uit; ze codificeren het verleden.’ En om de gevolgen daarvan te begrijpen, hebben we geschiedkundig onderzoek nodig naar de oorsprong van data. Alleen dan kunnen we de verouderde normen en waarden die aan de data kleven, achter ons laten.”

Boeken die Iris Clever in haar werk heeft gebruikt.

Schrijf je in voor de nieuwsbrief NRC Wetenschap

Op de hoogte van kleine ontdekkingen, wilde theorieën, onverwachte inzichten en alles daar tussenin

Lees meer

Source: NRC

Home

‘Datawetenschap en statistiek zijn beslist geen neutrale tools – ze stonden centraal in de rassen­wetenschap’