Coderende wetenschappers: plaag of zegen?

Onlangs verschenen twee opinieblogs op de site van Nature over coderende wetenschappers. Het schijnt een waar drama te zijn, de onderzoekers denken dat ze het zelf wel kunnen of – wat vaker voor lijkt te komen – wegens tijd/geld/mens-gebrek het zelf dan maar even doen, want ach. Het hoeft toch maar een keer gebruikt te worden voor dat specifieke project. Vind zelf het wiel maar nog een keer uit.

Natuurlijk is het zo dat veel onderzoeksprojecten een specifieke dataset moeten verwerken die niet met een ander programma te verwerken is. Ook kan het zo lijken dat een dataset prima te verwerken is met een bestaand programma gemaakt door onderzoeksgroep X. Misschien even een klein stukje veranderen… De documentatie is misschien wat onduidelijk of helemaal niet aanwezig, maar ach, het lijkt toch wel op wat we nodig hebben.

Het bekendste voorbeeld is de rel die er ontstond rond het IPCC en de gelekte e-mails van de Climatic Research Unit (CRU) inzake klimaatverandering. De hackers (en de halve wereld daarna) dachten dat er data gemanipuleerd was. Dit bleek gelukkig niet zo te zijn na een grondig onderzoek. Het laat wel zien dat er redenen zijn voor ongerustheid rond onderzoeksresultaten, wat onder andere blijkt uit de volgende, weinig geruststellende zin van ene Harry van het CRU uit een van de e-mails:

“Yup, my awful programming strikes again,”

Hij probeerde bepaalde code aan te passen voor de verwerking van data van een weerstation in Mexico.

Belangrijke stappen in het proces van softwareontwikkeling zijn natuurlijk terug te vinden bij de professionele devvers: documentatie, versiecontrole, test de software en deel met anderen. Dat laatste heeft vele voordelen, namelijk dat je het inzichtelijk moet maken en er ook feedback op krijgt.

Maar het belangrijkste is toch wel: opleiding. Iedere wetenschapper zou toch tenminste een basiscursus programmeren gehad moeten hebben, zelfs als men zelf nooit een programma hoeft te schrijven. Ok, iedereen heeft wel eens een webpagina in elkaar ‘ge-html-d’, maar daar kom je er niet mee. Een deel zal met wat basic programmeertalen hebben gepield in zijn leven en dat is genoeg voor de spreekwoordelijke klok, alleen die klepel…

Een oplossing die aangedragen wordt is wederom: delen. Gedeelde code geeft niet de onderzoeksresultaten weer en mocht men daar bang voor zijn, kan de code gepubliceerd worden samen met de publicatie zelf. Als je bang bent dat mensen je op (schoonheids)foutjes zullen wijzen, ach, dat is dan alleen maar fijn en zorgt er misschien zelfs voor dat je later iets niet terug hoeft te trekken omdat het niet klopte. Daarbij komt: je staat toch achter het onderzoek, dus zou je ook moeten staan achter de gebruikte programma’s.

Open Source heeft in korte tijd heel wat wakker geschud in deze wereld en processen versneld en verbeterd, Open Access Science is toch al een goede eerste stap.

Daarna maar eens beginnen met de cursus “Hoe leg ik mijn ingewikkelde resultaten uit aan het publiek zonder dat die er hun eigen fantastische interpretaties op loslaten?” Maar dat is een ander onderwerp…

Bron: Computational science: …Error en Publish your computer code: it is good enough, beiden van de Nature-site

Categories: WetenschapTags:
Krijn

Krijn Soeteman is a Dutch science and technology journalist. He majored in the history of art and architecture. After his studies he started as a music video producer. This led to producing a Museum Night at the NEMO Science Museum, which eventually led to science journalism. And much more.