Intel Lunar Lake wordt de basis voor de eerste Core Ultra 200 processors - en is weer compleet anders dan Meteor Lake
Lunar Lake is de basis voor wat straks vermoedelijk de Core Ultra Processor Series 2 gaat heten. En daar binnen, Core Ultra 200V. Als dat klinkt als een snellere opvolger van Meteor Lake, moeten we je uit de droom helpen. Qua prestaties zullen Lunar Lake processors, op basis van wat we nu weten, niet sneller zijn dan de snellere Core Ultra Processor Series 1 modellen die op Meteor Lake zijn gebaseerd. Lunar Lake is ontworpen voor zeer compacte en toch relatief krachtige laptops, maar AI-prestaties lijken daarbij zwaarder te hebben gewogen dan klassieke cpu-prestaties.
Lunar Lake inhoud
De chip is namelijk voorzien van nieuwe P(restatie) rekenkernen, die minder taken tegelijk kunnen afhandelen. Daarnaast bevatten ze de helft minder E(fficiënte) rekenkernen in vergelijking met de eerste Core Ultra generatie. Lunar Lake leest daarmee als een niche binnen de volgende 'generatie' (dat woord gebruikt Intel liever niet meer), eerder dan dat het hiervoor representatief is. Deze architectuur is in vrijwel elk opzicht anders dan Meteor Lake. Hij heeft een andere opbouw, nieuwe P- en E-cores, een nieuwe videokaart en geheugen op de chip.
Daarmee doet Lunar Lake terugdenken aan Lakefield, een architectuur uit 2020. Het was de eerste waarin Intel grote en kleine rekenkernen combineerde, en de eerste die de Foveros-techniek gebruikte. Qua prestaties maakte Lakefield weinig indruk, en de erop gebaseerde chips belandden slechts in een handvol laptops. Maar het was een vroege indicatie van de richting die Intel ging inslaan. Lunar Lake zal in meer laptops belanden, maar de impact wordt waarschijnlijk pas de komende jaren zichtbaar. Zo is deze architectuur alleen al interessant als vooruitblik op wat Intel in de toekomst kan gaan doen.
Intel Lunar Lake: vóór alles focus op AI
Hoewel er voor doorsnee gebruikers nog maar weinig AI-toepassingen op de pc zijn, gaat dat zeer binnenkort wel veranderen. Microsoft zet met zijn Copilot+ PC concept sterk in op AI in Windows. Intel wil eind 2025 maar liefst 100 miljoen 'AI PC's' verkocht hebben, zodat software ontwikkelaars een markt hebben om voor aan de slag te gaan. Lokale AI (zie kader) is een kwestie van tijd, niet van wel of niet.
Binnen de berichtgeving over AI was die Copilot+ PC van Microsoft een opmerkelijke dissonant in de doorgaans innige samenwerking met Intel. Microsoft claimde een noodzaak voor een neural processing unit die minimaal 40 biljoen operaties per seconde (trillion operations per second, oftewel tops) kon verwerken, om voor het predicaat 'Copilot+ PC' in aanmerking te komen. En daarmee voor kopers te garanderen dat alle AI-noviteiten van de komende Windows versie beschikbaar zouden zijn. Meteor Lake heeft zo'n npu, maar die kan 'maar' 10 tops produceren.
Ondertussen introduceerde Qualcomm in nauwe samenwerking met Microsoft en zo'n beetje alle laptopmakers - doorgaans ook hecht met Intel - een eigen processor die tot 45 tops aan AI-rekenkracht moet leveren. Aanzienlijk meer dus dan Core Ultra Processor Series 1.
Nu duurt het ontwikkelen van een processor zeker een jaar of 4, 5. Dus Lunar Lake was al in een vergevorderd stadium toen duidelijk werd dat dit ging gebeuren. Het is dan ook lastig te stellen dat deze chip een reactie is op Qualcomm. Dat laat onverlet dat Intel de AI-capaciteiten van de nieuwe architectuur vóór alles benadrukt. De npu in Lunar Lake kan tot 48 tops aan - nipt meer dan de concurrent, maar Intel wijst ook graag naar de totale AI-verwerkingskracht. Combineer je die van de klassieke cpu kernen met de vernieuwde videokaart, dan komt het totaal op 120 tops. Dit is dan ook Intels AI-filosofie: sommige taken moeten draaien op de cpu, sommige op de npu en sommige op de gpu.
Intel heeft bovenstaande developer kit met Lunar Lake ontwikkeld om developers in staat te stellen hun AI-toepassingen op de chip te testen.
Krachtiger video en media in Lunar Lake
Die vernieuwde videokaart is dan ook een belangrijke troef in het verhaal van Lunar Lake. Intel neemt sinds enige jaren grafische rekenkracht serieus. In 2021 kondigde het de Alchemist architectuur aan voor videokaarten. Deze verscheen in 2022 in los te installeren exemplaren en in 2023 als onderdeel van Meteor Lake. Deze zogenaamde Arc Graphics krijgt een fikse opfrisbeurt in Lunar Lake.
De nieuwe architectuur heet Battlemage en moet een groot aantal zwakke punten van de voorganger wegnemen. Een belangrijke verandering voor prestatieverbetering is het in hardware uitvoeren van een veelgebruikte functie. Dit execute indirect moest tot dusver in software (door de cpu) worden uitgevoerd. De functie is onder meer vereist voor de Unreal 5 engine en zal daarmee in veel games worden benut. Maar ook in heel veel andere opzichten heeft Intel verbeteringen doorgevoerd. Het gevolg is dat de nieuwe 'Xe2 rekenkernen' veel krachtiger zijn dan de eerste versie. Intel claimt een prestatiewinst van 50%, wat een enorme toename is tussen twee generaties.
Een van de verbeteringen is de aanwezigheid van zogeheten Xe Matrix Extensions in de Arc gpu van Lunar Lake. Deze waren ook aanwezig in de eerste generatie Arc videokaarten, maar niet in de geïntegreerde versie in Meteor Lake. Ze helpen niet alleen met het versnellen van 3D-rekenwerk, maar zijn ook cruciaal voor de AI-rekenkracht. Meer praktisch merkbaar op korte termijn zijn ondersteuning van HDMI 2.1 én DisplayPort 2.1, alsmede eDP 1.5 - een interne snelle verbinding naar laptopschermen.
Daarnaast kan de nieuwe videokaart - middels de eveneens vernieuwde Media Engine - overweg met een groot aantal video codecs, die het in hardware kan decoderen én encoderen. Naast AV1 ondersteunt deze ook het gloednieuwe VVC, ook bekend als h.266. Deze opvolger van h.265 is niet alleen nog efficiënter (met dus kleinere bestandsgrootte tot gevolg), maar doet ook slimmigheden zoals naadloze aanpassing van de weergave resolutie. Wanneer je hiermee in de toekomst een YouTube video speelt en je moet schakelen tussen resoluties - bijvoorbeeld omdat je bandbreedte toe- of afneemt - gaat dat zonder hapering.
Waarom is 'lokale AI' oftewel de AI PC belangrijk?
De AI hype van de afgelopen jaren werd geheel gevoed door AI-toepasingen die 'in de cloud' draaien. ChatGPT, Stable Diffusion, Dall-E: alle zijn zogeheten large language models (llm's) die getraind zijn in gigantische datacenters en daar ook hun resultaten afleveren (inferencing, in jargon). Wie het nieuws rond AI een beetje heeft gevolgd, zal niet ontgaan zijn dat dit een hele dure onderneming is. Elke interactie met ChatGPT kost geld, voor energieverbruik en onderhoud van de servers in die datacenters.
Het trainen van de grote taalmodellen is iets dat voorlopig alleen in zo'n datacenter kan gebeuren. Het gebruik van zo'n model echter is, met enig kunst- en vliegwerk, iets dat ook op een laptop mogelijk is. Mits deze voldoende gespecialiseerde rekenkracht heeft. AI-berekeningen zijn overwegend zogeheten vector- en matrix-rekensommen. Zaken waar een klassieke processor niet per se goed in is, maar grafische kaarten wel. Neural processors zijn dat ook, en hebben als voordeel dat ze een stuk zuiniger zijn dan videokaarten.
Een belangrijke overweging om AI naar laptops te brengen is dus simpelweg een kostenplaatje. Voor aanbieders van AI-diensten is het een stuk gunstiger om die 'gratis' te laten draaien op een laptop, dan dat ze voor elke gebruiker een bedrag aan kosten moeten incalculeren.
Een tweede reden is privacy. AI maakt het mogelijk om slimme analyses te doen op grote datasets. Dat kunnen ook hele concrete zaken zijn, zoals je financiële gegevens over een langere periode. Maar dat zijn geen zaken die je graag uploadt naar een server in de cloud. Dat geldt ook voor het on the fly vertalen van een vertrouwelijk videogesprek, bijvoorbeeld.
Daarnaast is er snelheid: communicatie via het internet gaat gepaard met een vertraging (latency). Voor zaken die vragen om onmiddellijke verwerking is dat niet handig. Directe vertalingen of gegenereerde ondertiteling vaart niet wel bij te veel vertraging. Deze produceren op de laptop heeft veruit de voorkeur boven een rondje langs een server.
Andere redenen voor lokale AI zijn bijvoorbeeld personalisatie - AI op maat - en betrouwbaarheid. Door niet afhankelijk te zijn van een internetverbinding en de beschikbaarheid van een online AI dienst, neem je risico's weg dat je AI even niet beschikbaar is.
Veel meer AI-rekenkracht met een grotere, snellere NPU
De neural processing unit is in de Intel-filosofie de verwerker voor AI-instructies die continu beschikbaar moeten zijn. Daarbij kan je denken aan algoritmes die het werkgeheugen bewaken tegen anders niet te detecteren malware, maar ook aan large language models voor generatieve AI en virtuele assistenten en agents. De videokaart is niet efficiënt genoeg om continu actief te zijn (zoals iedereen weet die gaat gamen op een laptop). De npu is dat wel.
Het exemplaar in Lunar Lake (NPU 4) is een doorontwikkeling van die in Meteor Lake (NPU 3). De toename van 11,5 tops naar 48 tops is vooral mogelijk door méér transistors, die op hogere snelheid werken. De capaciteit is verdrievoudigd; door een nieuw productieprocedé, een hogere kloksnelheid en verbeteringen in de architectuur wist Intel nog eens 40% hogere prestaties te bewerkstelligen.
Het resultaat is een fors hogere responsiviteit - iets als een beeldgenerator levert nu in ongeveer driekwart sneller resultaat. Tegelijkertijd nam het verbruik minder dan 15% toe.
Andere rekenkernen voor Prestaties en Efficiëntie
Zoals geschreven heeft Lunar Lake vernieuwde rekenkernen, de klassieke cpu-onderdelen die verantwoordelijk zijn voor traditionele taakverwerking. Zowel de P(restatie) als de E(fficiëntie) kernen zijn aangepakt. De veranderingen ten opzichte van de vorige drie generaties zijn groot.
Bij de P-kernen stapt Intel voor het eerst in zeer lange tijd af van HyperThreading. Dit is Intels naam voor simultaneous multithreading, een techniek om per klokslag van de processor twee taken in plaats van één uit te voeren. De gedachte achter de techniek is dat deze een rekenkern efficiënter benut, wat ook zo is. Het heeft echter ook nadelen: het vergt flink meer transistors op de processor en brengt veiligheidsrisico's met zich mee (op het moment dat een rekenkern twee taken afhandelt, kunnen deze elkaar beinvloeden en elkaars data uit het gedeelde cachegeheugen lezen). Bovenal neemt het nut van HyperThreading af, naarmate een processor meer fysieke rekenkernen bevat. Dat aantal nam de laatste jaren sterk toe.
Intel heeft becijferd dat veruit de meeste workloads voor gewone gebruikers en programma's vier threads (oftewel taken) of minder omvatten en zelden meer dan acht. Om die reden achtte het opportuun om HyperThreading vaarwel te zeggen. De Lion Cove P-cores zijn hierdoor kleiner en efficiënter, terwijl Intel daarnaast winst wist te behalen in de rekenefficiëntie (instructions per clock oftewel ipc). Ook kunnen ze veel nauwkeuriger terug- en opschakelen in kloksnelheid. Dat gaat nu in stapjes van 16,67 MHz in plaats van 100 MHz. Hierdoor kunnen de P-cores dichterbij hun maximale potentieel binnen de toegestane verbruiksruimte komen. Deze en vele andere optimalisaties moeten voor een prestatiewinst van 10 tot 18% zorgen, waarbij de toename bij laag verbruik relatief het hoogste is.
E-core met P-core prestaties
De verandering bij de E-cores is nog aanzienlijk groter. Meteor Lake had twee typen E-cores, een blok van 8 in de compute tile en nog twee in het low power island. Qua plaatsing op de die zijn de E-cores in Lunar Lake beter vergelijkbaar met de LPE-cores van Meteor Lake, dan met die in de compute tile. De opbouw is echter heel anders. Skymont, zoals de nieuwe kernen heten, is véél krachtiger dan voorganger Crestmont. Er zijn er vier van, en ze kunnen meer instructies per seconde verwerken, meer integer- en drijvende kommaberekeningen uitvoeren, maar ook meer AI-rekenwerk doen.
De prestatietoename vergeleken met de voorganger is enorm. Skymont kan de topprestaties van Crestmont leveren voor een derde van het verbruik, levert bij hetzelfde verbruik 70% hogere prestaties en kan in theorie twee keer zo hoge prestaties bieden als het verbruik het toestaat. Dat is bij verwerking van een enkele taak. Bij multithreading is het verschil nog groter. Gemiddeld genomen is een Skymont E-kern iets sneller (!) dan een Raptor Cove P-kern. Met de nuancering dat bepaalde taken die om een hoog piekvermogen vragen, beter draaien op Raptor Cove. Maar workloads die bij relatief laag verbruik kunnen worden uitgevoerd, handelt Skymont sneller af.
Deze verbetering moet ervoor zorgen dat Lunar Lake processors, ondanks hun beperking tot 8 rekenkernen voor 8 threads, toch goede responsiviteit en prestaties kunnen bieden.
Geheugen op de chip bij Lunar Lake
Iets anders dat daaraan bijdraagt, is dat het werkgeheugen van de laptop bij Lunar Lake processors op de chip is geplaatst, in plaats van op het moederbord. Dat betekent dat de processor sneller toegang heeft tot data in dat geheugen. Intel specificeert bovendien lpddr5x geheugen met zeer hoge snelheid (8533 MT/s).
Het betekent ook, dat je geen geheugen kan uitbreiden. Nu is dat zelden het geval bij 'thin & light' laptops, maar er is ook een beperking - vooralsnog - tot 32 gigabyte. Er passen twee geheugenchips op de processor en momenteel zijn de grootste chips van dit type 16 GB per stuk. Komen grotere beschikbaar, dan is er geen technisch beletsel voor chips met bijvoorbeeld 64 GB.
Naar verluidt komen er Core Ultra 5 processors met zowel 16 als 32 GB geheugen, terwijl Core Ultra 7 processors altijd 32 GB zullen hebben. Intel liet officieel nog niets los over de uiteindelijke processors die op Lunar Lake gebaseerd zullen zijn, dus hierbij kan je maar beter een slag om de arm houden.
Slimmere taakverdeling met Lunar Lake Thread Director
Met de 12e generatie Alder Lake architectuur introduceerde Intel noodzakelijkerwijs een techniek om taken over de P- en E-cores te verdelen, de Thread Director. Deze krijgt in Lunar Lake een aanpassing.
In de 12e, 13e en 14e generatie Core i-processors werkte het als volgt: veeleisende taken gingen naar de P-kernen, minder urgente naar E-kernen, en wanneer capaciteit op P-kernen beschikbaar kwam, verplaatste de Thread Director die taken van E naar P. In Meteor Lake, ofwel de Core Processor Series 1, was het net andersom. Taken werden eerst toegewezen aan de LPE-cores op het low power island. Had dat niet genoeg capaciteit, dan gingen ze naar de E-core cluster op de compute tile. Waren die ook niet toereikend, dan pas werden de P-cores ingezet.
Lunar Lake houdt het simpeler: taken draaien in principe op de - nu veel krachtiger - E-kernen. Alleen als die het niet redden, gaan ze naar de P-kernen. Samen met een optimalisatie in Windows (containment zones, die taken kunnen dwingen om alleen op E- of alleen op P-kernen te werken) moet de vernieuwde Thread Director voor een efficiëntere werking zorgen, zonder dat je als gebruiker een vertraging merkt wanneer een taak draait op een niet-toereikende rekenkern.
Een bijkomend voordeel moet een forse afname van het stroomverbruik zijn, wat moet bijdragen aan een langere werktijd op een acculading.
De modernste standaarden voor verbindingen naar buiten
We haalden het al even aan, Lunar Lake ondersteunt - eindelijk, in sommige gevallen - moderne versies van aansluitingen. In de brede zin van het woord, bedraad en draadloos. Voor video noemden we al HDMI 2.1 en DisplayPort 2.1, en er is ook ondersteuning ingebakken voor drie Thunderbolt 4 aanslutiingen. Voor Thunderbolt 5 apparaten is er meer bandbreedte beschikbaar, al blijft een aparte chip wel vereist voor deze standaard.
Wat een vraagteken is, is in welke mate fabrikanten van laptops alle moderne standaarden ook zullen implementeren. Zo vereisen HDMI 2.1 en DisplayPort 2.1 eigen aansluitingen - ze zijn niet te combineren met Thunderbolt 4. DisplayPort 2.1 kan wel via tThunderbolt 5 lopen, maar daarvoor is dus een aparte chip nodig.
Ook voor de verbinding naar het ingebouwde scherm is de vraag of alle mogelijkheden worden benut. De eDP 1.5 standaard maakt veel leuks mogelijk. Zoals automatische aanpassing van de verversingsfrequentie aan het bronmateriaal, zodat bij filmmateriaal met 24 beelden per seconde automatisch naar 48 Hz wordt geschakeld. Of Panel Replay, dat in theorie een enorme energiebesparing met zich mee kan brengen, doordat het beeldscherm een eigen buffer krijgt. Dit is een doorontwikkeling van Panel Self Refresh, dat een beeldscherm in een soort statische stand kon zetten als er geen pixels veranderden. Panel Replay maakt het in theorie mogelijk om een scherm zelfstandig een film te laten spelen, terwijl de rest van het systeem in slaapstand gaat.
Dit vereist wel een geschikt paneel, dat duurder zal zijn dan een simpeler versie. De ervaring leert dat fabrikanten terughoudend zijn om die investering te doen en/of de prijs van het uiteindelijke product te verhogen. Tenzij Intel dit vereist in bijvoorbeeld de Evo-richtlijnen - maar desgevraagd kon men ons nog niet melden of hierop aanpassingen zouden komen bij introductie van op Lunar Lake gebaseerde processors.
WiFi 7 met extra mogelijkheden
Op draadloos gebied is er ingebouwde ondersteuning voor WiFi 7 en Bluetooth 5.4. Het inbakken van het digitale gedeelte van de WiFi verbinding moet naast een lager verbruik ook een kleinere fysieke chip voor de verbinding met de antennes mogelijk maken. De Bluetooth-verbinding loopt in Lunar Lake bovendien via pci-express in plaats van usb, met een energiebesparing tot gevolg.
Op het vlak van WiFi biedt Lunar Lake een paar nieuwtjes. In de eerste plaats heeft Intel een systeem ontwikkeld om met één radio twee antennes afzonderlijk aan te sturen. Dit noemt het Enhanced Multi-Link Single-Radio (EMLSR). Het gebruik van een enkele radio is voordeliger en vergt minder ruimte, maar maakt verbindingen ook gevoeliger voor haperingen. EMLSR moet dit oplossen, door een alternatieve route te vinden naar het draadloze toegangspunt. Deze oplossing is volgens Intel ook efficiënter dan implementaties met meerdere radio's. Het moet stabiele WiFi 7-verbindingen voor toepassingen als VR headsets mogelijk maken.
Meer tot de verbeelding sprekend is de WiFi sensing techniek die Intel ontwikkelde. Door de mogelijkheid de antennes afzonderlijk te besturen, kan een Lunar Lake laptop met de ene een signaal zenden en met de andere ontvangen. Door het ontvangen signaal te analyseren, kan een algoritme bepalen of er een object met een bepaalde dichtheid en andere karakteristieken die overeenkomen met een menselijk lichaam, gedetecteerd werden. Zo kan een Lunar Lake laptop automatisch in stand-by gaan of starten als je wegloopt of gaat zitten.
Wat we nog niet weten: prijzen en snelheden
Intel heeft veel verteld over Lunar Lake, maar nog amper iets over wat de daadwerkelijke Core Ultra 200V processors moeten gaan presteren in de praktijk. Zo vertelde het nog niets over het verbruiksplafond (tdp) en over kloksnelheden. Uit gesprekken met medewerkers van het bedrijf, die zich fameus op de vlakt houden over zaken die tot 'de toekomst' worden gerekend, maken we op dat het verbruik tussen de 8 en 30 watt zal liggen. De kloksnelheden zullen waarschijnlijk in elk geval boven de 5 gigahertz kunnen uitkomen, maar de 6 vermoedelijk niet passeren.
Daarmee zullen de prestaties van deze processors vermoedelijk liggen tussen de Core Ultra U- en H-serie processors van 'Series 1'. Alles aan Lunar Lake is ontworpen voor kleine moederbordjes die in dito laptops gaan belanden, vergezeld van een bovenmodale accu. Ultralicht, relatief snel en - vermoedelijk - niet goedkoop. Zaken als het geheugen op de chip en de Foveros-verpakkingstechniek zijn verre van goedkoop. Ook Meteor Lake laptops zijn relatief duur (de goedkoopste kost op dit moment nog altijd 800 euro), met prijzen ruim boven de 1000 euro. Het is niet onrealistisch om aan te nemen dat Lunar Lake laptops nog duurder uit gaan pakken.
Daarmee komen ze vermoedelijk op een prijsniveau dat vergelijkbaar zal zijn met dat van de modellen met een Snapdragon X aan boord. Of Intel daarmee op prijs wil gaan concurreren is een kwestie van afwachten. Het bedrijf zelf benadrukt 'AI at scale' te kunnen leveren, waarmee het impliceert dat het (veel) meer modellen in de markt gaat zetten dan de concurrentie. Het meldde al 80 'design wins' te hebben voor Lunar Lake, oftewel 80 verschillende modellen die de chip gaan voeren. Hoewel dat weinig is in vergelijking met een meer mainstream processorontwerp, is het voor zo'n specialistische chip opmerkelijk veel.
Wanneer die op de markt gaan komen, is nog niet heel duidelijk. Intel zet in het derde kwartaal chips te gaan leveren aan de klanten. Die kunnen kort daarna laptops naar de markt brengen, maar het is ook mogelijk dat een flink deel pas eind 2024, begin 2025 daadwerkelijk te koop is. Dat is in elk geval wanneer zakelijke afnemers doorgaans inkopen doen. In welke mate dat beschikbaarheid van Lunar Lake laptops voor consumenten bepaalt, is nog afwachten. Een aantal bedrijven toonde al modellen met Lunar Lake aan boord, waaronder Acer. Dat kon echter nog niets vertellen over die apparaten, behalve dat ze eraan komen - zelfs de definitieve naam werd nog onder de pet gehouden.
De toekomst: Arrow Lake
De architectuur voor de mainstream Core Ultra Processor Series 2 moet later dit jaar komen, mogelijk in september. Deze architectuur, codenaam Arrow Lake, bouwt naar verluidt voort op Meteor Lake. Denkelijk gaat het om een combinatie van de modulaire opbouw van die chip - met een aparte compute tile en SoC - en de nieuwe Lion Cove en Skymont rekenkernen. Het ligt in de lijn der verwachtingen dat ook hier een stevige npu aan boord zal zijn. Werkgeheugen op de chip is zeer onwaarschijnlijk voor deze architectuur.
Arrow Lake is 'full stack', wat inhoudt dat het naar desktop en laptop komt, met dus onder meer K-, S-, H- en U-uitvoeringen. Daarmee zal Arrow Lake vermoedelijk veel meer gebruikers bereiken dan Lunar Lake. De nu geïntroduceerde architectuur lijkt bovenal een showcase van wat Intel heeft bereikt en voor de toekomst kan gebruiken.