Mae Ponte Vecchio Intel a Zen 3 AMD yn Dangos Addewid Technoleg Pecynnu Lled-ddargludyddion Uwch

Trafododd Intel ac AMD rai o'u dyluniadau sglodion mwyaf datblygedig yn y Gynhadledd Cylchedau Talaith Solid Rhyngwladol yr wythnos hon, ac fe wnaethant dynnu sylw at y rôl y mae pecynnu uwch yn ei chwarae yn eu cynhyrchion sglodion pen uchel yn y dyfodol. Yn y ddau achos, mae'r galluoedd perfformiad trawiadol newydd yn dod o ddulliau modiwlaidd sy'n cyfuno blociau adeiladu a wneir mewn gwahanol fabs gan ddefnyddio gwahanol brosesau gweithgynhyrchu. Mae'n dangos potensial helaeth pecynnu sglodion yn nyfodol arloesi lled-ddargludyddion.

Mae marchnad darged Intel ar gyfer Ponte Vecchio fel modiwl perfformiad uchel i'w ymgorffori mewn systemau datacenter mawr. Mae'n uned brosesu graffeg (GPU), ac fe'i cynlluniwyd ar gyfer cymwysiadau mewn deallusrwydd artiffisial, dysgu peiriannau a graffeg gyfrifiadurol. Fe'i enwir ar ôl y bont garreg ganoloesol sy'n cysylltu'r Piazza della Signoria ar un ochr i Afon Arno yn Fflorens , yr Eidal â'r Pallazzo Pitti ar yr ochr arall. Un o uchafbwyntiau'r dyluniad yw sut mae'n cysylltu llu o sglodion arbenigol - blociau adeiladu cylched integredig y bwriedir eu cyfuno i wneud systemau cyflawn.

Mae Ponte Vecchio yn defnyddio wyth “teils” a gynhyrchwyd ar broses 5 nm fwyaf datblygedig Taiwan Semiconductor Manufacturing Company (TSMC). Mae gan bob teils wyth “Xe” creiddiau, ac mae gan bob un o'r wyth craidd yn eu tro wyth fector ac wyth injan matrics arbenigol. Mae'r teils yn cael eu gosod ar ben “teils sylfaen,” sy'n eu cysylltu â'r cof a'r byd y tu allan gyda ffabrig switsh enfawr. Mae'r deilsen sylfaen hon wedi'i hadeiladu gan ddefnyddio proses “Intel 7” y cwmni, sy'n enw newydd ar gyfer proses weithgynhyrchu SuperFin 10 nm uwch y cwmni. Mae yna hefyd system gof perfformiad uchel o'r enw “RAMBO,” sy'n sefyll am Random Access Memory, Bandwidth Optimized, a adeiladwyd ar deilsen sylfaen gan ddefnyddio technoleg rhyng-gysylltu Intel 7 Foveros. Mae llawer o flociau adeiladu eraill wedi'u hymgorffori hefyd.

Mae dyluniad Ponte Vecchio yn astudiaeth achos mewn integreiddio heterogenaidd - sy'n cyfuno 63 o deils gwahanol (47 sy'n cyflawni swyddogaethau cyfrifiadura ac 16 ar gyfer rheolaeth thermol) gyda chyfanswm o dros 100 biliwn o transistorau mewn un pecyn sy'n 77.5 x 62.5 mm (tua 3 x 2.5 modfedd). Nid oedd mor bell yn ôl pan oedd cymaint â hynny o bŵer cyfrifiadurol yn llenwi warws ac angen ei gysylltiad ei hun â'r grid trydanol. Mae'r heriau peirianneg mewn dyluniad o'r fath yn niferus:

Cysylltu'r holl rannau. Mae dylunwyr angen ffordd i symud signalau rhwng yr holl sglodion gwahanol. Yn yr hen ddyddiau, gwnaed hyn gyda gwifrau neu olion ar fyrddau cylched printiedig, a chysylltwyd sglodion trwy eu sodro i'r byrddau. Ond rhedodd hynny allan o stêm ers talwm, wrth i nifer y signalau a'r cyflymder gynyddu. Os rhowch bopeth mewn sglodyn sengl, gallwch eu cysylltu ag olion metel ym mhen ôl y broses weithgynhyrchu. Os ydych chi eisiau defnyddio sglodion lluosog, mae hynny'n golygu bod angen llawer o binnau cysylltu arnoch chi, a'ch bod chi am i'r pellteroedd cysylltu fod yn fyr. Mae Intel yn defnyddio dwy dechnoleg i gefnogi hyn. Y cyntaf yw ei “bont rhyng-gysylltiad aml-farw wedi'i fewnosod” (EMIB) sy'n cael ei wneud o lithriad bach o silicon a all ddarparu cannoedd neu filoedd o gysylltiadau ar y tro, a'r ail yw ei dechnoleg pentyrru marw-i-farw Foveros yn gyntaf. a ddefnyddir yn ei brosesydd symudol Lakefield.

Sicrhau bod yr holl rannau wedi'u cysoni. Unwaith y byddwch chi'n cysylltu llawer o ddarnau gwahanol, mae angen i chi sicrhau bod pob un o'r rhannau'n gallu siarad â'i gilydd mewn cydamseriad. Mae hyn fel arfer yn golygu dosbarthu signal amseru a elwir yn gloc, fel y gall yr holl sglodion weithio yn lockstep. Nid yw hyn yn ddibwys, gan fod signalau'n tueddu i wyro ac mae'r amgylchedd yn swnllyd iawn, gyda llawer o signalau'n bownsio o gwmpas. Mae gan bob teils cyfrifiadurol, er enghraifft, fwy na 7,000 o gysylltiadau mewn gofod o 40 milimetr sgwâr, felly mae'n llawer i'w gadw mewn cydamseriad.

Rheoli gwres. Mae angen llawer o bŵer ar bob teils modiwlaidd, ac mae ei gyflwyno'n unffurf ar draws yr wyneb cyfan wrth gael gwared ar y gwres a gynhyrchir yn her enfawr. Mae sglodion cof wedi'u pentyrru ers peth amser, ond mae'r gwres a gynhyrchir wedi'i ddosbarthu'n weddol unffurf. Gall sglodion neu deils prosesydd fod â mannau poeth yn dibynnu ar ba mor drwm y cânt eu defnyddio, ac nid yw'n hawdd rheoli gwres mewn pentwr sglodion 3D. Defnyddiodd Intel broses meteleiddio ar gyfer ochrau cefn sglodion, ac integreiddio'r rhain â thaenwyr gwres i drin y 600 wat rhagamcanol a gynhyrchir gan system Ponte Vecchio.

Roedd canlyniadau labordy cychwynnol a adroddodd Intel yn cynnwys perfformiad > 45 Teraflops. Bydd uwchgyfrifiadur Aurora sy'n cael ei adeiladu yn Labordai Cenedlaethol Argonne yn defnyddio mwy na 54,000 o Ponte Vecchios ynghyd â mwy na 18,000 o broseswyr Xeon cenhedlaeth nesaf. Mae gan Aurora berfformiad brig wedi'i dargedu o dros 2 Exaflops, sydd 1,000 gwaith yn fwy na pheiriant Teraflop. Yn ôl yng nghanol y 1990au pan oeddwn yn y busnes uwchgyfrifiaduron, roedd un peiriant Teraflop yn brosiect gwyddoniaeth $100 miliwn.

Zen 3 AMD

Soniodd AMD am ei graidd microbrosesydd ail genhedlaeth Zen 3 wedi'i adeiladu ar broses 7 nm TSMC. Dyluniwyd y craidd microbrosesydd hwn i'w ddefnyddio ar draws segmentau marchnad AMD, o ddyfeisiau symudol pŵer isel, cyfrifiaduron bwrdd gwaith, a'r holl ffordd i'w weinyddion datacenter mwyaf pwerus. Egwyddor ganolog y strategaeth hon oedd pecynnu ei graidd Zen 3 gyda swyddogaethau cymorth fel “cymhleth craidd” ar sglodion sengl, a oedd yn gwasanaethu fel blociau adeiladu modiwlaidd yn debyg iawn i deils Intel. Felly gallent becynnu wyth sglodyn gyda'i gilydd ar gyfer bwrdd gwaith neu weinydd perfformiad uchel, neu bedwar sglodyn ar gyfer system werth, fel system gartref rhad efallai y byddaf yn ei phrynu. Mae AMD hefyd yn pentyrru sglodion yn fertigol trwy ddefnyddio'r hyn a elwir yn vias trwodd-silicon (TSVs), ffordd o gysylltu sglodion lluosog a osodir ar ben ei gilydd. Gallai hefyd gyfuno dau i wyth o'r sglodion hyn â dei gweinydd a wnaed ar broses 12 nm GlobalFoundries i wneud ei 3 nm.rd sglodion gweinydd EPYC cenhedlaeth.

Y cyfle gwych y mae Ponte Vecchio a Zen 3 yn ei amlygu yw'r gallu i gymysgu a chyfateb sglodion a wneir gan ddefnyddio gwahanol brosesau. Yn achos Intel, roedd hyn yn cynnwys rhannau a wnaed ar ei ben ei hun yn ogystal â phrosesau mwyaf datblygedig TSMC. Gallai AMD gyfuno rhannau o TSMC a GlobalFoundries. Mantais fawr o gysylltu sglodion neu deils llai gyda'i gilydd yn hytrach nag adeiladu un sglodyn mawr yn unig yw y bydd y rhai llai yn cael cynnyrch gweithgynhyrchu gwell ac felly'n llai costus. Gallwch hefyd gymysgu a chyfateb sglodion newydd gyda rhai hŷn profedig y gwyddoch eu bod yn dda, neu sy'n cael eu gwneud ar broses lai costus.

Mae'r dyluniadau AMD ac Intel yn dechnegol tours de force. Diau eu bod yn cynrychioli llawer o waith caled a dysg, ac yn cynrychioli buddsoddiad enfawr o adnoddau. Ond yn union fel y cyflwynodd IBM is-systemau modiwlaidd yn ei brif ffrâm System/360 yn y 1960au, ac aeth cyfrifiaduron personol yn fodiwlaidd yn yr 1980au, mae rhaniad modiwlaidd microsystemau silicon fel y dangosir gan y ddau gynllun hyn ac a alluogwyd gan becynnu sglodion uwch yn rhagflaenu newid sylweddol mewn technoleg. Wedi'i ganiatáu mae llawer o'r galluoedd a ddangosir yma yn dal i fod allan o gyrraedd y rhan fwyaf o fusnesau newydd, ond gallwn ddychmygu, pan ddaw'r dechnoleg yn fwy hygyrch, y bydd yn rhyddhau ton o arloesi cymysgedd-a-match.

Ffynhonnell: https://www.forbes.com/sites/willyshih/2022/02/22/intels-ponte-vecchio-and-amds-zen-3-show-the-promise-of-advanced-semiconductor-packaging- technoleg/