De met Sun overgenomen processorafdeling van Oracle heeft op het Hot Chips-symposium in Cupertino het nieuwe topmodel SPARC T5 gepresenteerd. Deze reuzenchip biedt op één die 16 cpu-kernen, 8 MB L3-cache, 8 DDR3-controllers, 16 PCIe 3.0-lanes en een geweldig interconnectsysteem. Met dat laatste kan iedere chip contact opnemen met zeven andere. Dat betekent dat in een 8-socket-server elke processor zonder omweg (1 hop) direct met elke andere kan communiceren. Als een verbinding ondanks de beschikbare 28 GB/s (14 lanes) toch volledig belast is, kunnen de cpu’s andere processors als relaisstation inschakelen. Dat betekent wel meer latentie, maar verhoogt ook de bandbreedte. In servers met twee of vier sockets zijn de afzonderlijke knopen steeds met vier dan wel twee interconnects verbonden. Afzonderlijke interconnects gaan in de slaapstand op het moment dat er geen gebruik gemaakt wordt van hun bandbreedte.
De afzonderlijke S3-kernen zijn in essentie tot 28nm-structuren verkleinde versies van de kernen van de SPARC T4 (40nm). Ze hebben een kloksnelheid tot 3,6 GHz, maar kunnen om energie te besparen ook langzamer draaien. Ze werken out-of-order en gebruiken een pipeline van 16 niveaus. Elke kern kan zijn resources en rekenwerk dynamisch verdelen over 1 tot 8 zogeheten strands (threads). Bovendien is er steeds nog een co-processor voor crypto-algoritmes en het genereren van toevalsgetallen. Dat die direct in de kern zit is volgens Oracle vooral handig voor de live migratie van virtuele machines.
Oracle is vooral trots op een nieuw snooping- en transactionprotocol. Daarmee gaan aanvragen tegelijkertijd naar de DRAM-controller en naar knopen verderaf, waardoor de latentie tot 31 procent minder wordt. Al met al is de beschikbare bandbreedte indrukwekkend. Zo leveren de verbindingen naar het werkgeheugen meer dan 1 TB/s, via het coherentienetwerk blijft daar nog 840 GB/s van over en via PCIe 3.0 256 GB/s. Dankzij diverse optimalisaties van de processor voor Oracles eigen software gaat de fabrikant uit van een vrijwel perfecte performanceschaling van een tot acht sockets, zelfs als bij OLTP-operaties communicatie tussen de knopen nodig is.