c’t 06/2026
Apple MacBook Neo – de Windows-killer?
Cover van
digi-inf introscan structuur van datahandel

Hoe één websitebezoek tientallen advertentiebedrijven over jou informeert

Databrokers maken van alledaagse informatie een handelswaar. De handel in gebruikersgegevens is goed voor een omzet van honderden miljarden dollars per jaar. Bijna niemand kent de processen en de spelers, hoewel vrijwel iedereen met zijn online activiteiten ‘grondstoffen’ levert aan deze sector.

Van klik tot profiel: de handel in persoonsgegevens uitgelegd

Het is woensdagmiddag, 14:37 uur. Een vrouw uit Nijmegen opent een pagina op een nieuwssite op haar smartphone. Daarmee zet ze een wereldwijde machine in gang. Die registreert haar locatie, haar apparaat, haar browserinstellingen en tientallen andere gegevens, analyseert en evalueert deze.

Een online veilingplatform veilt een advertentieruimte op de nieuwssite terwijl deze laadt. Daarbij vermeldt deze de verzamelde gegevens in de veilingbeschrijving. Het bedrijf met het hoogste bod krijgt de opdracht en toont haar uiteindelijk een advertentiebanner die is afgestemd op haar profiel.

Het hele proces – van het openen van de pagina en het verspreiden van de gegevens naar tientallen biedende bedrijven tot het weergeven van de gepersonaliseerde advertentie – gebeurt in een oogwenk en verloopt volledig onopgemerkt op de achtergrond.

Dit artikel belicht de technische en economische infrastructuur die deze reclamemachine en vele andere kanalen voorziet van locatiegegevens, consumptiegewoonten, relatiestatus, kredietwaardigheid, gezondheidsgegevens, politieke voor­keuren en nog veel meer gegevens: zorgvuldig verzameld, ge­­koppeld en gebundeld in gestandaardiseerde pakketten.

De belangrijkste spelers in deze sector zijn databrokers. Hun bedrijfsmodel bestaat eruit om van de digitale sporen die mensen in hun dagelijks leven achterlaten, verhandelbare goederen te maken.

Lees dit artikel verder

Lees over tech-trends en achtergronden, nieuwe apparatuur, software en toepassingen voor professioneel gebruik. Met c’t heb je altijd de juiste tech-informatie. Word abonnee en lees onbeperkt alle artikelen.
Bekijk abonnementen Al abonnee? Log in

Miljardenmarkt

De economische dimensies van deze industrie zijn indrukwekkend. Verschillende marktanalyses schatten de wereldwijde markt voor databrokers over 2024 op een waarde tussen 277 en 434 miljard Amerikaanse dollar. Dat komt ongeveer overeen met het bruto binnenlands product van Tsjechië.

Hoe deze gigantische omzetten tot stand komen, blijft voor de meeste mensen echter een raadsel. Dat komt niet alleen door de technische complexiteit van de gebruikte systemen, maar ook door de opzettelijke ondoorzichtigheid waarmee veel spelers opereren.
Volgens schattingen zijn er wereldwijd 4000 tot 5000 data­brokers actief. De meeste van deze be­­drijven zijn onbekend bij het grote publiek.

De ruwe gegevens waarmee datahandelaren werken, zijn afkomstig uit een groot aantal bronnen. Hoewel openbare registers, kredietinformatie en adres­databanken nog steeds een rol spelen, zijn de verzamelbronnen in de loop der jaren drastisch uitgebreid. Tegenwoordig wordt informatie overal verzameld waar digitale apparaten in het spel zijn, of het nu gaat om smartphones, pc’s, smart-tv’s of wearables.

Veel data via smartphones

Het belangrijkste hulpmiddel is de smartphone: mensen hebben hem altijd bij zich en brengen uren door met het swipen in apps. Moderne smartphones zitten vol met sensoren: gps-modules, versnellingssensoren, gyroscopen, barometers, helderheidssensoren, microfoons, camera’s.

Elk van deze sensoren levert gegevens die kunnen worden geëvalueerd voor profilering. Locatiegegevens zijn bijzonder waardevol. Deze gegevens geven niet alleen op elk moment weer waar iemand zich op dat moment bevindt, maar maken het ook mogelijk om conclusies te trekken over woon- en werkplaats, levensstijl, sociale contacten, gezondheidstoestand en politieke overtuigingen.

Analysediensten, advertentienetwerken en socialemedia-beheerders zorgen ervoor dat apps toegang hebben tot veel gegevens. Zij stellen software development kits (SDK’s) ter beschikking aan ontwikkelaars. Dit zijn programmacode-bibliotheken die app-ontwikkelaars in hun applicaties integreren om bepaalde functies te kunnen gebruiken.

Analysediensten helpen bijvoorbeeld bij het opsporen van zwakke plekken in de apps; reclame financiert de programmeerkosten en de werking van de apps. De apps sturen de verzamelde gegevens niet alleen naar hun eigen ontwikkelaars, maar ook naar de SDK-aanbieder – en van daaruit vaak door naar datahandelaren.

Gebruikerskenmerken en advertentieruimte

Wanneer een gebruiker een website bezoekt, plaatst de websitebeheerder de advertentie ruimte op een Supply Side Platform (SSP), dat het aanbod via een Ad Exchange (veilingplatform) doorstuurt naar een of meer Demand Side Platforms (DSP). Als een DSP een campagne heeft die bij de gebruiker past, biedt het op de advertentieruimte. Als het de veiling wint, levert het de advertentie.

digi-inf gebruikerskenmerken en advertentieruimte
Bron Dr. Johnny Ryan


De meeste gebruikers weten niet welke SDK’s in hun apps zijn geïntegreerd en welke gegevens deze verzamelen. Ze merken hooguit dat de apps ongewoon veel rechten vragen, rechten die ze eigenlijk helemaal niet nodig hebben, bijvoorbeeld wanneer de zaklamp-app je locatie wil weten en de weer-app je telefoonboek wil uitlezen.

Een gemiddelde smartphone-app kan tien of meer SDK’s bevatten die de gegevens wild over het web distribueren. Vermenigvuldigd met tientallen geïnstalleerde apps ontstaat een dicht netwerk van gegevensverzamelaars.

De omvang van de gegevensstroom via de smartphone wordt geïllustreerd door de ‘Databroker Files’ – een uitgebreid onderzoek waarbij onder andere verschillende internationale media samenwerkten. Ze hebben verschillende datasets van datahandelaren geanalyseerd. Een van de onderzochte datasets bevat 380 miljoen locatiegegevens uit 137 landen. Dit was slechts een sample van de datahandelaar, die de gegevens van één enkele dag in juli 2024 omvat.

In totaal zijn de gegevens afkomstig van ongeveer 40.000 apps. Nauwkeurige locatiegegevens waren onder meer afkomstig van apps als FlightRadar24.

Verzamelwoede: browser

We hebben bij c’t meerdere keren uitgebreid verslag gedaan van tracking in de browser en tips en trucs om je ertegen te weren. In het kort: de reclamesector bedenkt steeds nieuwe trucs om gebruikers over verschillende websites heen te volgen. Jarenlang hebben browsers zelf de technologie hiervoor geleverd: third-party cookies. Sinds steeds meer browsers deze cookies blokkeren, worden andere technieken gebruikt. Hiertoe behoren verschillende fingerprinting-procedures, die proberen een unieke ‘vingerafdruk’ van het betreffende apparaat te genereren.

Fingerprinting was lange tijd publieke­lijk verguisd en verboden in platformbeleidsregels. Nog maar een paar jaar geleden noemde Google fingerprinting een techniek die ‘de keuzevrijheid van gebruikers ondermijnt en verkeerd is’. In de praktijk werd fingerprinting in het verleden echter grotendeels getolereerd en stiekem gebruikt.

Sinds begin 2025 staat Google zijn partners nu officieel digitale fingerprinting toe. Naast fingerprinting gebruikt de reclame-­industrie nog veel meer ­methoden voor tracking. De fabrikanten van browsers en adblockers proberen op hun beurt deze praktijken te voorkomen: een voortdurend kat-en-muisspel.

Verraderlijke veiling

Real-Time Bidding (RTB) is een veilingsysteem voor advertentieruimte. Zoals in het voorbeeld aan het begin van dit artikel, worden advertentieruimtes op websites of in apps geveild. Achter RTB zit een nauwkeurig gechoreografeerd proces dat binnen 100 milliseconden wordt afgerond.

Wanneer een gebruiker een website bezoekt, verzamelt een in de website ingebed JavaScript-bestand van een advertentienetwerk gegevens aan de kant van de klant: type apparaat, besturingssysteem, schermgrootte, geolokalisatie (GPS- of ip-gebaseerd), browserdetails en contextuele signalen zoals de bezochte url, inhoudscategorie en uit de paginatekst geëxtraheerde trefwoorden.

Deze gegevens worden per JavaScript doorgestuurd naar een zogenaamd Supply Side Platform (SSP). Dit is een dienstverlener die namens de websitebeheerder advertentieruimte beheert en verkoopt. Het Supply Side Platform (SSP) stelt een biedingsverzoek samen dat alle verzamelde gebruikersgegevens bevat. Deze biedingsaanvraag wordt naar het veilingplatform (ad exchange) gestuurd, dat deze naar tientallen demand side platforms (DSP’s) distribueert.

De DSP’s analyseren de biedingsaanvraag om te bepalen welke advertentie uit hun huidige inventaris het beste past en hoeveel hun bod voor de advertentie waard is. De ad exchange ontvangt biedingen van meerdere DSP’s en bepaalt de winnaar van de veiling. Deze wordt vervolgens op de hoogte gebracht en levert de advertentie aan het apparaat van de gebruiker.

Online reclameveilingen: het verloop

Wanneer je een website bezoekt, vindt er tijdens het laden een bliksemveiling plaats, waarbij de hoogste bieder een open advertentieruimte reserveert en deze vervolgens meteen met zijn advertentie vult. Het traject van gebruikersprofielen via gegevensverzamelaars naar veilingdeelnemers en verder is niet onderworpen aan regulering of toezicht en vormt een zone waar geen gegevensbescherming geldt.

digi-inf online reclameveilingen - het verloop


Real-time bidding fungeert ook als een enorm systeem voor gegevensuitstroom. Bij elke veiling worden consumenten­gegevens tegelijkertijd naar mogelijk tientallen bieders verzonden, hoewel slechts één bieder – de winnaar van de veiling – deze gegevens daadwerkelijk nodig heeft om een op maat gemaakte advertentie te leveren. Er zijn nauwelijks technische controlemechanismen die ervoor zorgen dat de andere partijen deze gegevens niet voor onbedoelde doeleinden bewaren.

De Amerikaanse mededingingsautoriteit FTC heeft in 2024 beschuldigingen geuit tegen de databroker Mobilewalla, die vaak zonder toestemming gevoelige locatiegegevens van consumenten verzamelde, bewaarde en deze gegevens met derden deelde. De klacht tegen Mobilewalla illustreert het probleem: het bedrijf zou gegevens van verloren veilingen hebben verzameld en bewaard, hoewel de advertentiebeurzen dit expliciet hadden ver­boden.

Aangezien RTB-veilingen miljarden keren per dag plaatsvinden en bij elke transactie tientallen bedrijven betrokken zijn, ontstaat er een oncontroleerbare gegevensstroom. Zelfs als de meerderheid van de betrokkenen zich aan de regels houdt, zijn er maar een paar zwarte schapen nodig om enorme hoeveelheden ge­gevens af te romen.

Data-raffinaderijen

De ruwe gegevens van smartphones, browsers en veilingsystemen zijn op zichzelf slechts beperkt bruikbaar. Pas door ze te koppelen, te verrijken en te analyseren ontstaan de hoogwaardige profielen die op datamarkten kunnen worden verhandeld. Dit hele proces wordt data-enrichment genoemd.

Het gaat erom gefragmenteerde gegevenspunten uit verschillende bronnen toe te wijzen aan één persoon of huishouden. Een persoon laat sporen achter op verschillende apparaten (smartphone, laptop, tablet), gebruikt verschillende browsers en apps, wisselt tussen wifi en mobiel internet, gebruikt verschillende e-mailadressen en heeft interactie met tientallen diensten.

De belangrijkste uitdaging voor databrokers is om al deze fragmenten te herkennen als behorend tot één identiteit. De eerder genoemde cookies, browser-­fingerprinting en soortgelijke technieken in de browser spelen hierbij een rol. Smartphones bieden bijvoorbeeld zogenaamde Mobile Advertising ID’s (MAID’s). Aan de hand van zijn MAID kan een apparaat ook worden herkend als het met verschillende apps wordt gebruikt.

Persoonsherkenning

Daarnaast hanteert de branche een reeks identificatiegegevens om een persoon te herkennen. Daartoe behoort de Unified ID 2.0. In plaats van cookies wordt een pseudonieme identificatie gebruikt. Deze is gebaseerd op het e-mailadres of telefoonnummer van de gebruiker en werkt dus overal waar de gebruiker zich aanmeldt.

Als er geen unieke identificatiegegevens beschikbaar zijn, maken reclamebedrijven gebruik van probabilistische tracking, dat wil zeggen waarschijnlijkheidsbereke­ningen. Daarbij verzamelen ze gegevens zoals ip-adressen, browserversies, scherm­resoluties, locatiegegevens, tijdstempels en gebruiksgewoonten en vergelijken ze deze met elkaar.

Als bijvoorbeeld een smartphone en een laptop regelmatig vanaf hetzelfde wifi-netwerk worden gebruikt, op hetzelfde tijdstip van de dag vergelijkbare websites bezoeken en vergelijkbare interesses vertonen, kan een algoritme met grote waarschijnlijkheid concluderen dat beide apparaten van dezelfde persoon zijn. Technieken zoals ‘Continuity’ van Apple, ‘Chrome Tab Sync’ van Google, ‘Continue on PC’ van Microsoft, ‘Flow’ van Samsung enzovoort helpen daarbij.

Dergelijke technieken zijn dus niet alleen ontwikkeld voor het gemak van de gebruikers, maar ook om de gegevens beter te kunnen samenvoegen. Het resultaat zijn zogenaamde Unified Customer Profiles of 360-gradenoverzichten: database-items die alle beschikbare informatie over een persoon bundelen. Dit soort profielen kunnen honderden kenmerken omvatten: van demo­grafische basisgegevens, aankoopgeschiedenis en websitebezoeken tot daaruit afgeleide eigenschappen zoals kredietwaardigheid, politieke voorkeuren of gezondheidsrisico’s.

Om deze matching- en verrijkings­processen te kunnen uitvoeren, is er een aparte markt voor data-enrichment-software ontstaan. Een typische workflow ziet er als volgt uit: een bedrijf beschikt over een lijst met e-mailadressen van zijn nieuwsbriefabonnees. Via een verrijkingsprogramma stuurt het deze adressen naar een databroker. Deze vergelijkt ze met zijn databases en levert aanvullende informatie terug, bijvoorbeeld leeftijd, geslacht, woonplaats, geschat inkomen, burgerlijke staat, interesses en eerdere aankopen bij andere handelaren.

Het bedrijf kan nu zijn marketing nauwkeuriger afstemmen: individuele aanbiedingen voor verschillende in­­komensgroepen, verschillende boodschappen voor verschillende levensfasen.

Data-supermarkt

Voor de verkoop van datapakketten heeft de branche een eigen infrastructuur ontwikkeld: op grote marktplaatsen bieden aanbieders zoals Amazon hun datapakketten aan met uitgebreide beschrijvingen. Kopers kunnen het aanbod doorzoeken, filteren en pakketten met een paar muisklikken direct aanschaffen.

Een van de grootste van deze datamarktplaatsen heet Datarade. Deze marktplaats laat zien hoe dergelijke marktplaatsen werken. Meer dan 500 aanbieders stellen daar datasets beschikbaar in meer dan 500 categorieën, van ‘geospatial data’ tot ‘consumer data’, ‘political data’ en location data’.

De homepage is op dezelfde manier opgebouwd als een klassieke webshop voor fysieke goederen. Geïnteresseerden kunnen het aanbod in de volledige tekst doorzoeken of gegevens van een categorie laten weergeven. Er zijn geavanceerde filteropties waarmee je de zoekopdracht bijvoorbeeld kunt beperken tot individuele aanbieders of tot datasets die bepaalde landen omvatten.

Voor elke dataset heeft Datarade een gedetailleerd profiel beschikbaar met de omvang, de opgenomen landen, de kosten en een gegevenswoordenlijst. Dit laatste geeft een gedetailleerd overzicht van de afzonderlijke velden, dus een overzicht van de vastgestelde kenmerken en attributen.

Wie zich gratis op het platform aanmeldt, krijgt bij veel datasets een aantal echte voorbeeldgegevens te zien. Sommige aanbieders stellen ook grotere gratis voorbeeldpakketten ter beschikking. Via het contactformulier kunnen geïnteresseerden snel contact opnemen met de verkopers als ze nog vragen hebben.

Datarade biedt datasets in verschillende formaten, afhankelijk van het beoogde gebruik. Voor analisten en dataspecialisten zijn gestructureerde formaten zoals CSV-, JSON- of Excel-bestanden beschikbaar om te downloaden. Deze zijn geschikt voor statistische evaluaties, bijvoorbeeld om markttrends te analyseren of klantprofielen op te stellen.

Wie grotere hoeveelheden gegevens wil verwerken, kan gebruikmaken van databasedumps of gespecialiseerde formaten zoals Parquet, die efficiënt in datawarehouses kunnen worden geïntegreerd.

API’s

Voor tijdkritische toepassingen zijn statische datasets niet voldoende. Hier komen API’s om de hoek kijken: programmeerinterfaces die realtime-query’s mogelijk maken. Het typische scenario ziet er als volgt uit: een onlinewinkel ontvangt een bestelling.
Voordat de bestelling definitief wordt bevestigd, stuurt het systeem een API-verzoek naar een databroker: ‘Wat weten we over dit e-mailadres?’ Binnen milliseconden komt het antwoord terug met informatie over het geschatte inkomen, het eerdere koopgedrag, de betalingsbetrouwbaarheid en het risico op fraude. Op basis daarvan kan de winkel beslissen welke betaalmethoden worden aangeboden of dat er een kredietwaardigheidscontrole wordt vereist.

Dergelijke realtime-query’s zijn inmiddels standaard in veel sectoren. Verzekeraars gebruiken ze om premies dynamisch aan te passen. Banken controleren kredietaanvragen in seconden in plaats van dagen. Marketingplatforms personaliseren website-inhoud op basis van het profiel van de bezoeker. De API-infrastructuur maakt de handel in gegevens onzichtbaar en alomtegenwoordig tegelijk.

Verschillende prijzen & gratis ‘sample’

De prijzen en prijsmodellen van de bij Datarade verhandelde gegevenspakketten variëren sterk. Sommige pakketten kosten slechts een paar honderd dollar. Andere worden gefactureerd op basis van het aantal API-oproepen of leads. Als een onlinewinkel bijvoorbeeld een verkoop genereert met behulp van de gegevens, moet er een paar cent of dollar worden betaald.
Permanente toegang tot een echt grote bron met de gegevens van honderden miljoenen mensen kan echter ook wel 10.000 dollar of meer per maand kosten.

Hoe explosief en verstrekkend de informatie is die via dergelijke marktplaatsen kan worden verkregen en hoe gemakkelijk dit gaat, bleek uit het onderzoek van ‘Databroker Files’. Netzpolitik.org ontving in de zomer van 2024 3,6 miljard locatiegegevens van mensen in Duitsland – zomaar, als gratis proefmonster.

De gegevens bevatten bewegingsprofielen van ongeveer 11 miljoen apparaten en maakten het mogelijk om mensen tot in hun woning te volgen of bezoeken aan afkickklinieken, bordelen of psychiaters te traceren.

Bijzonder rampzalig: ook bewegingsprofielen van medewerkers van Duitse geheime diensten en het ministerie van Defensie waren in de dataset opgenomen – een aanzienlijk veiligheidsrisico voor de nationale veiligheid.De Amerikaanse gegevensleverancier Datastream Group bood deze geoinformatie aan voor een maandelijks abonnement van ongeveer 14.000 dollar – elk uur bijgewerkt, uit maximaal 163 landen.

De zaak maakt duidelijk: wat op dergelijke marktplaatsen een onschuldig bedrijfsmodel lijkt, kan in werkelijkheid democratiebedreigende dimensies aannemen. De Duitse regering en gegevensbeschermers eisten als gevolg daarvan een algemeen verbod op de commerciële handel in locatiegegevens.

Mobiele besturingssystemen

De fabrikanten van mobiele besturingssystemen, Apple en Google, zijn begonnen te reageren op de steeds verdergaande gegevensverzameling. Apple introduceerde met iOS 17 zogenaamde privacymanifesten – verklaringen die SDK-ontwikkelaars verplichten hun praktijken op dit gebied openbaar te maken.

Google ontwikkelt met de SDK Runtime voor Android een sandboxing-systeem dat SDK’s afschermt van apparaat-ID’s. Deze maatregelen tonen aan dat zelfs de platformbedrijven het ongebreidelde verzamelen van informatie op hun platforms als problematisch hebben erkend.

Of deze maatregelen echt een oplossing bieden, is echter de vraag. Ook van de kant van de overheid hoeven de gegevenshandelaren tot nu toe nauwelijks beperkingen te vrezen. De markt wordt gekenmerkt door een lappendeken van internationale en Amerikaanse federale wetten met veel mazen in de wet, waardoor de gegevenshandel niet effectief wordt gereguleerd.

Conclusie

De handel in gegevens is een wijdvertakte, zeer winstgevende machine die digitale sporen omzet in profielen, profielen in voorspellingen en voorspellingen in winst. Met duizenden spelers en een geavanceerde technische infrastructuur heeft zich een sector ontwikkeld die syste­matisch persoonlijke informatie omzet in verhandelbare goederen. Overheids­instanties slagen er tot nu toe niet in om deze markt effectief te reguleren.

Als individu kun je je niet meer helemaal aan dit systeem onttrekken, daarvoor is het veel te nauw verweven met veel te veel aspecten van het leven. Om de situatie te verbeteren, moeten wetgevers de gegevenshandelaren strakker onder controle houden.

Als je zelf een bijdrage wilt leveren en druk wilt uitoefenen op de politiek, steun dan organisaties als Noyb (None of your business), EDRi (European digital rights) of EFF (Electronic Frontier Foundation). Zij zetten zich in voor een transparantere handel in gegevens en een betere controle door democratisch gelegitimeerde or­­ganen.

Jo Bager en Alieke van Sommeren

Inspiratie in je mailbox

Blijf bij op IT-gebied en verbreed je expertise. Ontvang elke week artikelen over de laatste tech-ontwikkelingen, toepassingen, nieuwe hard- en software én ontvang tips en aanbiedingen.

Loginmenu afsluiten