datacarriere.com

Het verbeteren van de steekproefstrategie voor de Community Innovation Survey met behulp van machine learning algoritmes

Rapport
30-03-2026
Jonas Klingwort
Statistische instituten gebruiken steeds vaker niet-steekproefdata naast registers om statistieken te verbeteren. Dit onderzoek toont hoe aanvullende databronnen steekproeven optimaliseren en de nauwkeurigheid van schattingen binnen innovatieonderzoek verder vergroten.

Het verbeteren van de steekproefstrategie voor de Community Innovation Survey met behulp van machine learning algoritmes

Er is een groeiende interesse bij statistische bureau’s om voor het maken van officiele statistieken gebruik te maken van nieuwe data bronnen zoals informatie beschikbaar op het internet, sociale mediaberichten, sensordata en web-scraped data. Het gebruik van dit soort gegevens als primaire databron impliceerd een verhoogd afbreukrisico omdat een statistisch intsituut bijvoorbeeld geen controle meer heeft over de beschikbaarheid van de gegevens of de vergelijkbaarheid ervan in de tijd. Om deze risico's tot een minimum te beperken, wordt in dit paper voorgesteld om informatie uit dit soort gegevensbronnen te gebruiken als hulpinformatie om de steekproefstrategie van een kanssteekproef te verbeteren. Dit concept wordt geïllustreerd met een toepassing op de Community Innovation Survey (CIS).

Drie bronnen voor het verbeteren van de weging van de CIS zijn onderzocht: (1) web-scraped data die aangeven hoe groot de kans is dat een bedrijf innovatief is, (2) administratieve gegevens van bedrijven die subsidies voor onderzoek en ontwikkeling ontvangen, en (3) administratieve gegevens over het aantal patenten dat een bedrijf heeft. Met behulp van gegevens uit de CIS van 2016, wordt onderzocht in hoeverre de nauwkeurigheid van de schattingen uit de enquête kan worden verbeterd door te wegen naar populatieverdelingen die zijn gebaseerd op deze hulpbronnen. Aan de hand van deze analyses wordt onderzocht of de bestaande wegingsmethode kan worden verbeterd en welke hulpbron hiervoor het meest geschikt is. Daarnaast draagt dit paper bij aan de discussie over het gebruik van traditionele en nieuwe gegevensbronnen voor het maken van officiële statistieken.

[....]

Lees verder op: cbs.nl

Gerelateerde vacatures

Geïnteresseerd in een carrière bij organisaties in ditzelfde vakgebied? Bekijk hieronder de gerelateerde vacatures en vind de perfecte match voor jou!
Robeco
Marktconform
Senior
Rotterdam
As a Senior AI and Data Engineer at Robeco, you build and deploy production-ready AI solutions, translate ideas into prototypes, collect and analyze data, develop predictive and generative models, run...
Autoriteit Persoonsgegevens (AP)
4.691 - 7.747
Medior, Senior
Den Haag
Als ML-expert met ervaring in AI- en algoritmetoezicht bij de Autoriteit Persoonsgegevens werk je aan toezicht op AI-systemen: risico’s duiden, verantwoorde inzet onderbouwen, testfaciliteiten ontwikkelen, standaarden voor de AI-verordening vormgeven...
PMT pensioenfonds Metaal & Techniek
Marktconform
Medior, Senior
Den Haag
Als Specialist Ketenregie bij PMT pensioenfonds Metaal & Techniek beheer je portefeuilles in interne beheersing, IT, informatiebeveiliging en kwaliteitsmanagement, en ondersteun je portfolio- en projectmanagement met planning, rapportages en stakeholdercommunicatie.
Meer lezen
Assets Only
Marktconform
Medior, Junior
Amsterdam
Als Lead Datamanagement bij Assets Only organiseer je data en governance zodat organisaties aantoonbaar in control zijn. Je vertaalt eisen uit Risk, Compliance en ESG naar beleid, inrichting, datakwaliteit, eigenaarschap,...