Home
Achtergrond
Benchmarks voor kwantumcomputers: theorie vs praktijk

Benchmarks voor kwantumcomputers: theorie vs praktijk

Alieke van Sommeren Alieke van Sommeren Vandaag

Fabrikanten onderbouwen de prestaties van hun kwantumcomputers vaak met abstracte benchmarks. Googles Random Circuit Sampling bijvoorbeeld brengt zelfs experts in verwarring en wordt als volkomen nutteloos beschouwd. We bekijken hoe deze methoden werken en hoe nuttig ze werkelijk zijn.

Benchmarking van kwantumcomputers: meetmethoden zonder vaste maatstaf

Kwantumcomputers zijn een technologische disruptie die nog in de kinderschoenen staat. Verschillende bedrijven doen onderzoek naar deze supercomputers en volgen daarbij deels fundamenteel verschillende benaderingen. Het is zelfs nog niet duidelijk in welke vorm qubits, de basisbouwstenen van kwantumcomputers, het beste kunnen worden geïmplementeerd: atomen, lichtdeeltjes, diamanten of minuscule schakelingen zijn slechts enkele van de kandidaten.

Het is moeilijk te zeggen wie er voorop loopt, omdat het een grote uitdaging is om verschillende technieken op een zinvolle manier te vergelijken. Benchmarking probeert dit probleem op te lossen. Bij conventionele computers vloeien de relevante vergelijkingsformaten voort uit de toepassing en geldt meestal: hoe sneller, hoe beter.

Bij kwantumcomputers is het echter nog onduidelijk voor welke toepassingen ze in de toekomst geschikt zullen zijn. Daarom is het moeilijk om vergelijkbare meetwaarden te identificeren en een benchmarkprocedure te kiezen die ook in de toekomst nog relevant zal zijn. Dit resulteert in een enorm scala aan verschillende procedures. In dit artikel belichten we enkele geavanceerde benchmarkingprocedures.

We leggen hun voor- en nadelen uit, hun eerlijkheid en wat ze onthullen over de vooruitgang van kwantumcomputers. Maar laten we vooropstellen: kwantumcomputers zijn nog ver verwijderd van praktische toepassingen en er is nog geen concreet nut aangetoond dat alleen een kwantumcomputer kan realiseren.

Basiselementen

De bouwstenen van een kwantumcomputer werken zo nauwkeurig dat ze de fundamentele wetten van de natuur aantikken. Ze rekenen met behulp van kwantumeffecten (zie het kader verderop) en zijn daarom nauwelijks te vergelijken met conventionele computers. Kwantumcomputers zijn momenteel eerder grote laboratoriumopstellingen met een grote soft- en hardwarestack.

Slechts één element daarvan is de kwantumchip, de zogenaamde Quantum Processing Unit (QPU). Bij de huidige ontwikkeling van kwantumcomputers telt zowel de interactie tussen alle componenten in de stack als de correcte werking van de componenten. Voor beide delen bestaan benchmarks. De moeilijkheid daarbij is dat de componenten van elke kwantumcomputerarchitectuur anders werken en soms meer, soms minder relevant kunnen zijn voor de prestaties van de gehele kwantumcomputer.

kwanbench_01_kwantumprocessor — De kwantumcomputers van Google gebruiken supergeleidende schakelingen als qubits. De eigenlijke kwantumprocessor is slechts een klein onderdeel aan de onderkant van de constructie. De rest dient voornamelijk voor de koeling en controle van de qubits, die idealiter continu op een constante temperatuur dicht bij het absolute nulpunt worden gehouden. (Foto Google Quantum AI)

Compileren, uitvoeren

Een piano produceert geluiden met behulp van toetsen en pedalen. Voordat er muziek klinkt, vertaalt de pianist de noten dus in verschillende bewegingen van zijn vingers en voeten. Op dezelfde manier splitsen natuurkundigen berekeningen op in elementaire bewerkingen, de zogenaamde kwantumpoorten. Deze stap wordt compilatie genoemd; het is een puur klassieke stap die met normale computers wordt uitgevoerd.

Afhankelijk van het type kwantumcomputer is de compilatie meer of minder complex. Een kwantumcomputer met ionenvallen verplaatst bijvoorbeeld voor een berekening ionen fysiek heen en weer en bestraalt ze op het juiste moment met lasers. De compilatie moet daarom de beweging van de ionen coördineren.

Bij supergeleidende kwantumcomputers komen de instructies daarentegen overeen met kleine stroompjes die door zeer fragiele schakelingen vloeien. In de volgende stap worden de gecompileerde schakelingen georkestreerd, dat wil zeggen dat de instructies in de optimale volgorde worden geplaatst. Dit komt overeen met een muzikant die nadenkt over hoe hij zijn handen positioneert en met welke kracht hij welke snaar of toets aanslaat.

In de laatste stap voert de kwantumchip de instructies daadwerkelijk uit. Dit is vergelijkbaar met de muzikant die de muziek nu daadwerkelijk speelt. Het resultaat hangt daarbij af van de vaardigheden van de muzikant en de kwaliteit van het instrument.
Hetzelfde geldt voor kwantumcomputers. Elke computer compileert, optimaliseert en voert kwantumschakelingen op een andere manier uit.

Verschillende qubit-architecturen reageren bovendien verschillend op foutbronnen, zoals temperatuurschommelingen, strooivelden of andere deeltjes in de omgeving. Een eerlijke vergelijking is dus erg moeilijk. De kwantumcomputersimulator belooft een oplossing. Hierbij bootst een conventionele computer de processen in een kwantumcomputer na door gebruik te maken van de wiskunde van de kwantumfysica.

In tegenstelling tot een kwantumcomputer levert de simulator exacte rekenresultaten. Omdat de wiskunde zo complex is, kan de simulator kwantumschakelingen echter alleen tot een bepaalde grootte uitvoeren, omdat ze anders te veel rekenkracht vereisen.
In de muziekmetafoor komt de simulator overeen met de digitale track van een perfect bespeeld en gebouwd instrument. Subtiliteiten gaan daarbij verloren, maar de digitale track is geschikt om te vergelijken met de echte muziek en de kwaliteit ervan te beoordelen.

kwanbench_02 — Een typisch kwantumcircuit bevat diverse instructies voor de kwantumcomputer (links). Het wordt van links naar rechts gelezen en lijkt qua concept op een blad muziek voor muziekinstrumenten (rechts). (Afbeelding Davide Ferari et al./Public Domain)

Valkuilen van benchmarking

Eenvoudige kwaliteitskenmerken van kwantumcomputers zijn bijvoorbeeld het foutpercentage van kwantumpoorten, de stabiliteit van de qubits of samengestelde grootheden zoals het kwantumvolume. Deze zijn echter meestal gericht op afzonderlijke eigenschappen van de qubits of de kwantumcomputer. Hieronder presenteren we twee complexere benchmarks die verschillende aspecten van kwantumcomputers met elkaar vergelijken.

Volumetrische benchmarking

Het principe van volumetrische benchmarks is om steeds grotere kwantumschakelingen op een kwantumcomputer uit te voeren en de kwaliteit ervan te controleren. Het zogenaamde volume van de berekeningen neemt dus toe, vandaar de naam. De resultaten worden stapsgewijs vergeleken met die van een simulator.

Volumetrische benchmarks zijn vooral populair bij fabrikanten van ionvallen-kwantumcomputers. Een voorbeeld hiervan zijn de algoritmische qubits (zie de afbeelding hieronder). Deze meten, eenvoudig gezegd, hoeveel bruikbare qubits een kwantumcomputer effectief beschikbaar heeft voor berekeningen.

kwanbench_03 — Een typische volumetrische benchmark voor algoritmische qubits. Gekleurde vakjes staan voor uitgevoerde experimenten. De kleur geeft het succes weer: rode vakjes zijn mislukkingen, blauwe vakjes zijn successen. Hoe verder rechts en boven een experiment zich bevindt, hoe complexer en belangrijker het is voor de prestaties van een kwantumcomputer.

Concreet testen ze of een kwantumcomputer bepaalde kwantumcircuits, die relevant zijn voor grotere algoritmen, nu al met succes kan uitvoeren. In de muziekmetafoor zouden dit frasen van een muziekstuk zijn die vaak worden herhaald. In de test worden deze zowel met het echte instrument als met de digitale simulator gespeeld.

Als beide versies hetzelfde klinken, is de benchmark geslaagd. Hoezeer ze op elkaar moeten lijken en hoe de gelijkenis wordt gemeten, is echter niet gestandaardiseerd.

In het algemeen geldt: hoe langer en moeilijker de geteste passage is, hoe beter de kwantumcomputer is en hoe meer algoritmische qubits hij heeft.

Een echt voorbeeld van zo’n frase is de zogenaamde kwantum-Fourier-transformatie (QFT), die een essentiële rol speelt in het Shor-algoritme. Het Amerikaanse bedrijf IonQ gebruikt bijvoorbeeld algoritmische qubits om zijn kwantumcomputers op basis van ionenvallen te benchmarken. Algoritmische qubits zijn een voorbeeld van een holistische benchmark.

In dit kader voert een kwantumcomputer echte algoritmen uit en maakt daarbij gebruik van alle componenten van de software- en hardwarestack. De compilatie, optimalisatie en uitvoering op de QPU moeten goed op elkaar zijn afgestemd. Deze benchmark is dus niet bedoeld om aan te tonen dat kwantumcomputers berekeningen kunnen uitvoeren die een klassieke computer niet kan uitvoeren. Deze benchmark is bedoeld om de technische maturiteit van het totale systeem te meten.

Een punt van kritiek op deze benchmark is dat het vrij eenvoudig is om de resultaten te verfraaien. Enerzijds is het mogelijk om de kwantumcomputer precies voor deze toepassing te optimaliseren. De test laat dan wel zien hoe goed de kwantumcomputer deze specifieke toepassing kan uitvoeren, maar niet of willekeurige kwantumschakelingen succesvol zijn.

Het feit dat een muzikant één bepaald stuk heel goed beheerst, betekent nog niet dat hij ook een ander stuk onder de knie heeft. Bovendien hebben ionvallen-kwantumcomputers bij deze test een voordeel, omdat ze van nature minder foutgevoelig zijn dan supergeleidende machines. Ze kunnen bepaalde, veel voorkomende patronen in kwantumschakelingen heel eenvoudig uitvoeren.

Voor veel bewerkingen moeten bijvoorbeeld ver van elkaar verwijderde qubits worden verstrengeld, alsof je twee pianotoetsen aan tegenovergestelde uiteinden tegelijkertijd moet aanslaan. Ionenval-kwantumcomputers kunnen in dergelijke gevallen, figuurlijk gesproken, beide toetsen naar elkaar toe schuiven, ze met één hand tegelijk bespelen en ze vervolgens weer terugschuiven naar hun oorspronkelijke positie.

Dit is een voordeel bij het compileren en optimaliseren, waarbij gebruik wordt gemaakt van de beweeglijkheid van de ionen. Supergeleidende kwantumcomputers bestaan daarentegen uit vast ingebouwde elektrische schakelingen en kleine stroompjes moeten soms van het ene naar het andere uiteinde van de QPU worden getransporteerd, wat heel gemakkelijk tot grote fouten leidt.
In vergelijkingen presteren ionvallen-kwantumcomputers daarom regelmatig aanzienlijk beter dan supergeleidende kwantumcomputers. Maar ionvallen-kwantumcomputers rekenen langzamer en de tijd wordt niet meegenomen in de benchmark.

Qubits

De qubit is de kleinste rekeneenheid van een kwantumcomputer. Het is een veralgemening van een klassieke bit, die ofwel de waarde 1 ofwel de waarde 0 kan hebben. Een qubit kan echter, in tegenstelling tot een bit, in een superpositie van beide waarden bestaan. Dit kan eenvoudig worden voorgesteld als een munt die ofwel kop ofwel munt toont.

Als je tijdens het gooien vraagt welke kant naar boven ligt, heeft die vraag geen zin. De munt is in zekere zin beide, zolang hij niet wordt opgevangen; hij bevindt zich in een superpositie van de toestanden 1 en 0. Pas wanneer hij wordt opgevangen of gemeten, laat hij kop of munt zien.

Meerdere qubits kunnen bovendien met elkaar verstrengeld zijn. De munten zijn dan tijdens het gooien zo gesynchroniseerd dat hun draaiingen van elkaar afhankelijk zijn. Als een munt tot stilstand komt, stopt de andere ook onmiddellijk.

De waarde van een verstrengelde munt wordt volledig bepaald door de waarde van de munt waarmee hij verstrengeld is. Een kwantumcomputer rekent met meerdere van dergelijke verstrengelde kwantummunten en manipuleert ze als het ware tijdens de vlucht om na de meting een zinvol resultaat te verkrijgen.

Random Circuit Benchmark

Voor de tweede techniek, de Randomized Circuit Benchmark (RCB) of ook wel Random Circuit Sampling genoemd, wordt een willekeurig kwantumcircuit als basis gebruikt. Bij deze benchmark gaat het niet om het oplossen van een probleem, maar om het aantonen van een kwantumvoordeel. De test bestaat uit drie stappen.

Eerst wordt het willekeurige kwantumcircuit volledig gesimuleerd en wordt het resultaat opgeslagen. Dit komt overeen met het afspelen en opslaan van een willekeurige partituur met de ideale simulator. Daarbij speelt de simulator alle mogelijke muziekstukken af die uit de partituur kunnen voortkomen.

In de tweede stap wordt het kwantumcircuit enkele honderdduizenden keren uitgevoerd met zowel de echte kwantumcomputer als met de simulator en wordt voor beide de tijd gestopt. In de laatste stap wordt gecontroleerd of de gegenereerde resultaten van de echte kwantumcomputer correct zijn. Hiervoor wordt gecontroleerd of de afzonderlijke resultaten te vinden zijn in de volledige simulatie van het kwantumcircuit.

Deze stap controleert dus of de echte kwantumcomputer fouten heeft gemaakt. Omdat de huidige kwantumcomputers nog erg foutgevoelig zijn, kan het snel gebeuren dat de resultaten onjuist zijn en onbekend zijn voor de simulator. Hoe complexer het willekeurige circuit is, hoe moeilijker het voor de echte kwantumcomputer is om foutloos te rekenen.

Tegelijkertijd wordt het ook voor de simulator moeilijker om de oplossing te berekenen. Als een melodie bijvoorbeeld maar vijf toetsen van de piano nodig heeft, is deze gemakkelijker te spelen dan wanneer alle toetsen nodig zijn. In het geval van kwantumsimulatie kunnen dergelijke berekeningen honderden jaren rekentijd in beslag nemen.

Er is sprake van een kwantumvoordeel als de echte kwantumcomputer zowel voldoende zinvolle resultaten oplevert als sneller rekent dan de simulator.

Zoeken naar het kwantumvoordeel

Google Quantum AI gebruikt de RCB om zijn kwantumcomputer te testen, recentelijk voor zijn Willow-processor. Het bedrijf kondigde op zijn blog aan dat Willow de RCB in vijf minuten had uitgevoerd, terwijl de beste bekende simulator voor dezelfde taak 10 quadriljoen jaar (een 1 met 25 nullen) nodig had.

Ter vergelijking: volgens de huidige kennis is het universum ongeveer 14 miljard jaar oud: een 14 met slechts 9 nullen. Maar hoe weet Google dat het resultaat van zijn kwantumcomputer correct is, als de simulator de vergelijkende berekening duidelijk niet kan uitvoeren? Het antwoord is: dat weten ze niet. Het resultaat is niet verifieerbaar. Daarom spreekt Google inmiddels alleen nog maar over snellere rekentijden en niet over een kwantumvoordeel.

Onderbouwing

Google gebruikte echter een methode om de legitimiteit van zijn schattingen te onderbouwen. Stel je een zeer moeilijk muziekstuk voor, waarvoor je alle toetsen en pedalen van de piano nodig hebt. Maar je merkt dat het muziekstuk klinkt alsof het uit twee onafhankelijke stukken bestaat die tegelijkertijd worden gespeeld.

Dit is ook mogelijk bij echte kwantumberekeningen. De digitale simulator heeft misschien niet genoeg rekenkracht om het oorspronkelijke circuit te simuleren, maar hij kan de twee helften onafhankelijk van elkaar berekenen. Als de combinatie van de twee kleinere simulaties lijkt op het volledige experiment, wordt het circuit als ontleedbaar beschouwd en de simulatie als een geschikte benadering.

Bovendien zijn sommige stukken reduceerbaar, wat betekent dat ze op het origineel lijken, zelfs als versieringen en moeilijke passages worden verwijderd. Ook de gereduceerde simulatie kan een goede schatting van het origineel zijn.

Google controleert, figuurlijk gesproken, of de digitale muziek van het ontlede en het gereduceerde muziekstuk overeenkomt met het origineel. De onderzoekers stelden vast dat het resultaat erg gelijkwaardig klinkt en concludeerden dat dit ook voor willekeurig moeilijke muziekstukken moet gelden, mits er voldoende rekencapaciteit beschikbaar is.

Op basis van de vele tests krijgt het team een indruk van hoe de benodigde rekencapaciteit voor een volledige simulatie toeneemt met de complexiteit van het circuit. Zo slaagt het erin een zogenaamde indirecte verificatie uit te voeren: het kan de rekenbehoefte voor een simulatie inschatten zonder deze daadwerkelijk uit te voeren.

Kritiek op RCB

Deskundigen hebben vooral kritiek op twee punten van de RCB. Ten eerste is het een benchmark die precies is afgestemd op het QPU-ontwerp dat Google gebruikt voor zijn kwantumcomputers. Het ontwerp en de indeling van de kleine schakelingen worden gebruikt om de inspanningen voor compilatie en optimalisatie te elimineren en alleen de kwantumberekening op de QPU te benadrukken.
Zelfs een andere kwantumcomputer met supergeleidende qubits, bijvoorbeeld van IBM, zou deze test niet op dezelfde manier doorstaan. Bovendien zijn supergeleidende kwantumchips bijzonder goed in het uitvoeren van snelle rekenstappen, bijvoorbeeld in vergelijking met ionenvallen van IonQ of Quantinuum. Een typische rekenoperatie duurt op een supergeleidende kwantumcomputer slechts enkele nanoseconden, terwijl een ionval-kwantumcomputer meerdere microseconden nodig heeft. Aangezien tijd bij de RCB als een essentieel kwaliteitskenmerk wordt beschouwd, is dat een enorm voordeel.

kwanbench_04 — Ionenval-kwantumchips, zoals die van het Amerikaanse bedrijf IonQ, hebben geen koeling nodig, maar wel een zeer sterk vacuüm, zodat luchtdeeltjes de afzonderlijke ionen tijdens de berekening niet verstoren. (Foto IonQ)

Een laatste punt van kritiek is dat de RCB blijkbaar geen enkele echte toepassing heeft. De benchmark genereert willekeurige getallen zonder betekenis. Daar kunnen echter twee tegenargumenten tegen worden aangevoerd. Ten eerste is een toepassing niet het doel van de RCB. Deze benchmark is alleen bedoeld om een kwantumberekening uit te voeren die geen klassieke computer kan uitvoeren: hij is ontworpen om een kwantumvoordeel aan te tonen.

Maar zelfs dat is slechts een momentopname. In het algemeen kan nooit worden bewezen dat er geen efficiëntere methode bestaat om een probleem ook met een klassieke computer op te lossen.

Dit gebeurde bijvoorbeeld in 2019, toen Google voor het eerst een kwantumvoordeel aankondigde met zijn Sycamore-chip. Google verkondigde toen een berekening te hebben uitgevoerd die op de beste supercomputer duizenden jaren zou duren.

Kort daarna vonden andere onderzoekers echter een klassiek algoritme dat de taak in een paar uur oplost met een conventionele computer. Bovendien hebben willekeurige getallen een essentiële betekenis in veel cryptografische processen. Inmiddels wordt de RCB geherformuleerd om een nieuwe methode voor het genereren en certificeren van willekeurige getallen te creëren.

De eerste resultaten zijn onlangs gepubliceerd door de investeringsbank J.P. Morgan Chase in samenwerking met de bekende kwantuminformatica-wetenschapper Scott Aaronson in het vakblad Nature.

Wat de toekomst brengt

Het is een feit dat de huidige kwantumcomputers zeer foutgevoelig zijn. Toch zijn de resultaten tot nu toe vaak veelbelovend. Er zijn geen eerlijke vergelijkingen tussen verschillende soorten kwantumcomputers, maar sommige benchmarks bieden in ieder geval vergelijkbaarheid binnen een groep.

De algoritmische qubits laten zien hoe ver kwantumcomputers als totaalsysteem zijn ontwikkeld, omdat hier de volledige software- en hardwarestack bij betrokken is. Er wordt echter geen berekening uitgevoerd die een klassieke computer niet even goed of zelfs beter zou kunnen uitvoeren.

De RCB daarentegen is expliciet ontworpen om een kwantumvoordeel aan te tonen. Deze berekeningen testen alleen de prestaties van de QPU en laten de rest van de software- en hardwarestack buiten beschouwing.

Nieuwe benchmarks

Helaas gebruikt elke fabrikant zijn eigen benchmarks, waardoor vergelijkingen tussen verschillende kwantumcomputers zeldzaam zijn en ook weinigzeggend. De behoefte aan nieuwe, neutrale en betekenisvolle benchmarks is dan ook zeer groot. Toch ontwikkelen kwantumcomputers zich sneller dan veel experts hadden gedacht.

Er worden nu al nieuwe toepassingen ontwikkeld die een kwantumcomputer als essentiële technologie nodig hebben: of het nu gaat om een gecertificeerde random number generator of de verbeterde kernspinresonantiespectroscopie voor de analyse van moleculen door middel van het algoritme Quantum Echoes van Google. Het mooie hiervan is dat elke nieuwe toepassing ook altijd een kans is voor een nieuwe benchmark.

(Wadim Wormsbecher en Alieke van Sommeren, c’t 5/2026, p.54)

Alieke van Sommeren

Typen geleerd op een 8086 met DOS 5.0 en al vroeg zelf aan het pc-(ver)bouwen geslagen. Speelt graag pc-games, houdt van gadgets en klikt ook wat rond op een MacBook.