Steeds meer onderzoeksartikelen zijn nep. Wapens met namen die je eerder in een surrealistisch stripboek zou verwachten moeten helpen de uitweg te vinden.
Vervalst bewustzijn. Mensgemaakte hersenkracht. Boezemkwaadaardigheid. Nierteleurstelling. Onkwetsbaar kader.
Als u denkt: wat kraamt die Keulemans nou toch weer voor onzin uit – gelijk heeft u. Bovenstaande woorden zijn geen echt bestaande termen, maar kolderwoorden die zoal ontstaan als je bestaande vaktermen in een vertaalprogramma heen en weer kaatst tussen verschillende talen. Kunstmatige intelligentie verandert dan in ‘vervalst bewustzijn’ of ‘mensgemaakte hersenkracht’, borstkanker in ‘boezemkwaadaardigheid’, en op die andere twee mag u fijn puzzelen.
Ik kwam de woorden tegen in een boeiend stuk in vakblad Nature, over vervuiling van de wetenschappelijke vakliteratuur. U weet: in de wetenschap zijn gepubliceerde artikelen de munteenheid waarin vakkennis zich uitbetaalt.
En omdat wetenschappers nu eenmaal moeten publiceren om serieus te worden genomen, zijn er ook onderzoekers die hun cv oppompen met nepartikelen. Authentiek ogende publicaties, vaak ondergebracht op een net echte publicatiewebsite, die bij nadere inspectie blijken te bestaan uit bij elkaar gefantaseerde ChatGPT-diarree, of uit overgeschreven werk van anderen.
Maar met al die plagiaatsoftware van tegenwoordig moet je natuurlijk wel zorgen dat overgeschreven teksten een beetje onherkenbaar worden. Vandaar de truc: gooi een tekst net zo lang heen en weer in een wasmachine van vertalingen, tot lactose-intolerantie is witgewassen tot ‘melksuiker-onverdraagzaamheid’ en eindgebruikers zijn veranderd in ‘stopconsumenten’.
Vóór 2010 werden er jaarlijks maar enkele honderden vakartikelen plechtig teruggetrokken. Inmiddels zijn het er per jaar al veertienduizend, meer dan menig wetenschapper in zijn loopbaan überhaupt zou lezen.
Gelukkig is daar Guillaume Cabanac, een jonge hoogleraar computerwetenschap uit Toulouse die manieren ontwikkelt om de nepartikelen alsnog uit de vakliteratuur te wieden. Dat heeft geresulteerd in een arsenaal aan wapens met namen die je eerder verwacht in een surrealistische comic dan in de wetenschap.
Zoals de ‘Tortured Phrases Detector’, een stukje software dat artikelen afsnuffelt op zoek naar onzintermen die kunnen duiden op vertaalmachineproza. De ‘Problematic Paper Screener’, die op zoek gaat naar willekeurig gegenereerde wartaal. Of een ‘Feet of Clay Detector’, een programma dat controleert of de publicaties waarnaar een wetenschapswerk verwijst wel echt bestaan.
Want in een wereld waarin steeds meer wetenschapsartikelen nep zijn, wordt ook dat een probleem. Wetenschappers bouwen voort op elkaars werk, en je wilt niet dat dat bouwwerk rust op een modder van allang weer geschrapte papers – vandaar die ‘feet of clay’, de lemen voeten.
Nog deze zomer werd een oud artikel over stamcellen teruggetrokken wegens rammelende data, terwijl het intussen al vijfduizend keer door anderen is aangehaald. Tooltjes als die van Cabanac moeten zulke vervuiling in de literatuur automatisch aangeven.
Dat belooft nog wat, de komende jaren. Ik voorzie steeds meer teksten die volledig geautomatiseerd worden opgetrokken uit het niets. Maar ook tooltjes die volautomatisch zinnen gebaseerd op teruggetrokken onderzoek weer uit die vakartikelen weggummen. Voor uw ogen zullen de vakartikelen veranderen: hier verdwijnt ineens een zin, daar komt er plots een alineaatje bij. Het enige wat wetenschappers nog doen, is hun meetresultaten uploaden – als dat tegen die tijd niet al vanzelf gaat: recht vanuit de apparatuur zo de vakliteratuur in.
De wetenschap kan best zonder wetenschappers. Oftewel, in vertaalmachine-speak: de kennisopbergplank heeft potentie zonder grondleggers.
Geselecteerd door de redactie
Source: Volkskrant columns