Intel’den Bilgi Merkezi, HPC-AI ve İstemci Bilgi Süreci İçin Yeni Mimari

Intel’in 2021 Mimari Günü‘nde Raja Koduri ve Intel mimarları; iki yeni x86 çekirdek mimarisi hakkında bilgiler verdi. Akıllı Intel® Thread Director iş yükü zamanlayıcısı ile Intel’in “Alder Lake” kod isimli birinci performans hibrit mimarisine ait detaylar açıklanırken; Intel’in bilgi merkezi için gelecek kuşak Intel® Xeon® Scalable işlemcisi “Sapphire Rapids”, yeni altyapı süreç üniteleri tanıtıldı ve Xe HPG ve Xe HPC mikromimarileri ve Alchemist ile Ponte Vecchio SoCs’u içeren gelecek grafik mimarilerine ait ayrıntılar verildi.

Bu yeni mimariler, yarının yüksek performanslı eserlerine taban hazırlayacak ve daha yüksek bilgi süreç gücüne yönelik durmaksızın artan talepleri karşılamayı amaçlayan Intel’in yeni inovasyon çağının temellerini atacak.

Raja Koduri, bu talebi karşılamada mimari ilerlemenin ehemmiyetine değinerek şöyle konuştu: “Mimari, donanım ve dizaynın simyasıdır. Belli bir altyapıyı onun için en uygun transistörler ile birleştirir, onları ileri paketleme yoluyla bağlar, yüksek bant genişliği ve düşük güçlü önbellek entegre eder, bir paketteki hibrit bilgi süreç kümeleri için yüksek kapasiteli, yüksek bant genişlikli bellekler ve düşük gecikmeli ölçeklenebilir orta ilişkiler ile bunları donatır. Mimari, bunları yaparken, tüm yazılımların meselesiz bir halde hızlanmasını da sağlar.” … Masaüstünden data merkezine iş yükleri her zamankinden daha büyük, daha karmaşık ve daha çeşitli hâle gelirken, bugün bahsettiğimiz atılımlar, daha yüksek bilgi süreç performansına yönelik ezici talebi mimarinin nasıl karşılayacağını gösteriyor.”

Efficient çekirdek

Intel’in daha evvel “Gracemont” kod ismini verdiği yeni Efficient çekirdek mikromimarisi, çağdaş çoklu vazifeler için, iş çıkarma verimliliği ve ölçeklenebilir çok iş parçacıklı performansı sağlamak için tasarlandı. Bu, çok çekirdekli iş yüklerinin çekirdek sayısına nazaran ölçeklenebilmesini sağlayan agresif bir silikon alan amacı ile Intel’in en verimli x86 mikromimarisidir. Tıpkı vakitte geniş bir frekans aralığı da sunmaktadır. Mikromimari ve tasarım eforu, Efficient çekirdeğin daha yüksek frekanslarda işlemek için boşluk hissesi yaratırken, genel güç tüketimini azaltmak için düşük voltajda çalışmasına imkan tanımaktadır. Efficient core, bu formda daha güçlü iş yükleri için performansı artırabilir.

Efficient çekirdek, süreç gücünü israf etmeden iş yüklerini önceliklendirmek ve döngü başına yönergeyi (IPC) uygunlaştıran özelliklerle performansı direkt artırmak için aşağıdakileri de içeren çeşitli teknik ilerlemelerden yararlanır:

  • Daha gerçek dallanma öngörüsü sağlayan 5.000 bin girişlik dallanma amaç önbelleği
  • Bellek alt sistemi gücünü harcamadan faydalı yönergeleri yakında tutmak için 64 kilobayt yönerge önbelleği
  • Intel’in ön kod çözme bilgisi üreten birinci isteğe bağlı yönerge uzunluğu kod çözücüsü
  • Intel’in, güç verimliliğini korurken döngü başına altı yönergeye kadar kod çözme sağlayan kümelenmiş sıralama dışına çıkan kod çözücüsü
  • Beş genişliğinde atama ve sekiz genişliğinde devre dışı bırakma, 256 girişlik sıralama dışına çıkma penceresi ve 17 yürütme ilişki noktası ile geniş bir art uç
  • Intel kontrol akışı zorlama teknolojisini ve Intel sanallaştırma teknolojisi yönlendirme muhafazasını destekleyen üstün güvenlik özellikleri
    Tam sayı yapay zekâ (AI) süreçlerini destekleyecek yeni uzantılar ile birlikte AVX ISA’nın uygulanması

Tek iş parçacıklı performansta Intel’in en üretken merkezi süreç ünitesi (CPU) mikromimarisi olan Skylake SPU’ya kıyasla, Efficient çekirdek birebir güçte %40 daha yüksek performansa ulaşır ya da %40 daha az güç tüketerek birebir performansı sağlar. İş çıkarma yeteneği için, dört Efficient çekirdek; dört iş parçacığı çalıştıran iki Skylake çekirdekten %80 daha yüksek iş çıkarma yeteneği göstermesine karşın daha az güç tüketir ve tıpkı performansın %80 oranında daha az güç tüketerek elde edilmesini sağlar.

Performance çekirdek

Intel’in daha evvel “Golden Cove” kod ismini verdiği, sürat için tasarlanan yeni Performance çekirdek mikromimarisi, düşük gecikmeli ve tek iş parçacıklı uygulama performansının hudutlarını zorluyor. İş yükleri, kod ayak izleri büyürken daha fazla yürütme yeteneği talep ediyor. Bilgi kümeleri de, data bant genişliği ihtiyaçlarıyla birlikte ziyadesiyle büyüyor. Intel’in, yeni Performance çekirdek mikromimarisi, genel gayeli performansta kıymetli bir artış sağlar ve büyük kod ayak izli uygulamaları daha âlâ takviyeler.

Performance çekirdek daha geniş, daha derin ve daha akıllı bir mimari sunuyor:

  • Daha Geniş: altı kod çözücü (dörtten yükseldi), sekiz geniş µop önbellek (altıdan yükseldi), 6 atama (beşten yükseldi), 12 yürütme ilişki noktası (10’dan yükseldi)
  • Daha Derin: Daha büyük kayıt belgeleri, daha büyük fizikî kayıt belgeleri, 512 girişli daha derin yine sıralama arabelleği
  • Daha Akıllı: Geliştirilmiş dallanma öngörüsü doğruluğu, azaltılmış tesirli L1 gecikmesi, L2’de tam yazma öngörülü bant genişliği optimizasyonları

Intel’in şimdiye dek yaptığı en yüksek performanslı CPU çekirdek olan Performance çekirdek,  aşağıdakiler ile düşük gecikmeli ve tek iş parçacıklı uygulama performansının sonlarını zorluyor:

  • Genel hedefli performans için, ISO frekansta mevcut 11. Kuşak Intel® CoreTM işlemci mimarisine (Cypress Cove) kıyasla birçok iş yükünde ~%19’luk geometrik ortalama güzelleştirmesi
  • Daha fazla paralelliğe ve yürütme paralelliğinde artışa açık olma
  • Derin öğrenme çıkarımı ve eğitim performansı için; gelecek kuşak, yerleşik AI hızlandırma gelişimi olan Intel® Advanced Matrix Extensions. Bu; matris çarpma süreçlerini kıymetli ölçüde daha süratli gerçekleştirmek için, ayrılmış donanım ve yeni yönerge kümesi mimarisini içerir.
  • Büyük bilgiler ve büyük kod ayak izli uygulamalar için daha düşük gecikme ve daha yüksek dayanak

Alder Lake Client SoC

Daha evvel “Alder Lake” kod ismi verilen, Intel’in gelecek jenerasyon istemci mimarisi, Intel’in birinci performans hibrit mimarisidir ve tüm iş yükü tiplerinde manalı performans sağlamak için iki çekirdek cinsini (Performance core ve Efficient core) birinci sefer birleştirmiştir. Intel 7 işlemci üzerine kurulan Alder Lake, en son belleği ve en süratli I/O’yu dayanaklar.

Aşağıdaki üç kıymetli tasarım bileşenine sahip tek, yüksek seviyede ölçeklenebilir yongada sistem (SoC) mimarisinden faydalanan Alder Lake; ultra taşınabilir dizüstülerden teknoloji tutkunu ve ticari masaüstülere kadar tüm istemci segmentlerini desteklemek için ölçeklenen inanılmaz bir performans sunacak:

  • Liderlik performansı, güç verimliliği, bellek ve I/O’ya sahip olan, azamî performanslı, iki yongalı, soketli masaüstü
  • Görüntüleme, daha büyük Xe grafikleri ve Thunderbolt 4 temas sağlayan yüksek performanslı bir taşınabilir BGA paketi
  • Optimize edilmiş I/O ve güç dağıtımına sahip olan, ince, daha düşük güçlü, yüksek yoğunluklu bir paket.

Bu kadar yüksek seviyede ölçeklenebilir bir mimari oluşturmada güç olan, bilgi süreç ve I/O aracılarının inanılmaz bant genişliği taleplerini güçten ödün vermeden karşılamaktır.  Intel, bu zorluğun üstesinden gelmek için, her biri gerçek vakitli, talebe dayalı buluşsal metotlara sahip üç bağımsız yapı tasarladı:

  • Bilgi süreç yapısı, saniyede 1.000 gigabayta (GBp) kadar destekleyebilir – çekirdek başına ya da küme başına saniyede 100 GBp’tır ve çekirdekler ve grafiği, son düzey önbellek üzerinden belleğe bağlar.

               o  Yüksek dinamik frekans aralığı sunar ve gerçek yapı yüklerine dayalı olarak, gecikme-bant genişliği optimizasyonu için bilgi yolunu dinamik bir halde seçebilir

              o Son düzey önbellek siyasetini -kapsayıcı ya da kapsayıcı olmayan- kullanıma dayalı olarak dinamik bir halde ayarlar

  • I/O yapısı, 64 GBp’a kadar destekleyerek farklı I/O tipleri ve dahili aygıtları bağlar. Gereken bilgi transferi ölçüsünü karşılayacak yapı suratını seçerek, aygıtın olağan çalışmasına müdahale etmeden suratı sıkıntısız bir halde değiştirebilir.
  • Bellek yapısı, 204 Gbp’a kadar data sağlayabilir. Çoklu işletim noktalarını yüksek bant genişliği, düşük gecikme ya da düşük güç için desteklemek üzere, bilgi yolu genişliğini ve suratını dinamik bir biçimde ölçeklendirebilir.

Intel Thread Director

Intel, Performance ve Efficent çekirdeklerinin işletim sistemi ile meselesiz bir halde çalışması için, Intel Thread Director isimli gelişmiş bir zamanlama teknolojisi geliştirdi. Direkt donanımda yerleşik olan Thread Director, çekirdeğin durumuna ve iş parçacığının yönerge karışımına ait düşük düzeyli telemetri sağlar. Bu sayede, yanlışsız iş parçacığını gerçek çekirdeğe hakikat vakitte yerleştirmek için işletim sistemini güçlendirir. Thread Director, statik kurallara dayalı kolay bir yaklaşım benimsemez; dinamik ve uyarlanabilirdir – zamanlama kararlarını gerçek vakitli bilgi süreç gereksinimlerine nazaran ayarlar.

Klâsik olarak, işletim sisteminin karar verme süreci, ön plan ve art plan misyonları üzere mevcut hudutlu istatistiklere dayalıydı. Thread Director ise, aşağıdaki yetenekleri sayesinde karar verme sürecine yeni bir boyut katıyor:

  • Daha yüksek performans gerektiren iş parçacıklarını o anda gerçek Performance çekirdeğe yönlendirmek için donanım telemetrisini kullanma;
  • Yönerge karışımı, çekirdeğin durumu ve öteki ilgili mikromimari telemetrisini detaylı izleme ve böylelikle işletim sisteminin daha akıllı zamanlama kararları vermesine yardımcı olma;
  • Microsoft ile işbirliği yaparak, Intel Thread Director’ı Windows 11’de en yeterli performans için optimize etme;
  • Geliştiricilerin iş parçacıkları için hizmet kalitesi niteliklerini açıkça belirtmesine müsaade veren PowerThrottling API’yı genişletme;
  • İş parçacığı güç verimliliğini tercih ederse zamanlayıcıyı bilgilendiren yeni bir EcoQoS sınıflandırması uygulama (bu üzere iş parçacıkları Efficient çekirdeklerde zamanlanır).

Xe HPG Mikromimarisi ve Alchemist SoC’ler

Xe HPG,  oyun ve yaratıcılık iş yükleri için teknoloji meraklısı sınıfı performansına yönelik tasarlanan yeni bir grafik mikromimarisidir. Xe HPG mikromimarisi, SoC’lerin Alchemist ailesine güç katar. Birinci ilgili eserler, Intel® Arc™ markasıyla 2022’nin birinci çeyreğinde piyasaya sunulacak. Xe HPG mikromimarisi; bilgi süreç odaklı, programlanabilir ve ölçeklenebilir bir öğe olan yeni bir Xe çekirdeğe sahiptir.

İstemci grafik yol haritası, Alchemist (önceki ismiyle DG2), Battlemage, Celestial ve Sruid SOC’leri içerir. Sunum sırasında, mikromimarinin detaylarını açıklayan Intel; üretim öncesi Alchemist SoC üzerinde gerçek oyun tecrübesi, Unreal Engine 5 sıhhat testi ve XeSS ismi verilen yeni bir nöral tabanlı harika örnekleme teknolojisini gösteren demolar paylaştı

Xe HPG mikromimarisi tabanlı Alchemist SoC’ler, harika ölçeklenebilirlik ve bilgi süreç verimliliği sağlamak için aşağıdaki mimari özelliklerle tasarlandı:

  • DirectX 12 Ultimate için tasarlanan sabit fonksiyonlu sekiz manzara dilimine kadar
  • 16 vektör altyapısı ve 16 matris altyapısı (XMX – Xe Matrix uzantıları olarak anılır) bulunan yeni Xe çekirdekler, önbellek ve paylaşılan mahallî bellek
  • DirectX Raytracing (DXR) ve Vulkan Ray Tracing için dayanaklı yeni ışın izleme üniteleri
  • Mimari, mantık tasarımı, devre tasarımı, süreç teknolojisi ve yazılım optimizasyonlarının kombinasyonu sayesinde, Xe LP mikromimarisine kıyasla 1,5 kat frekans artışı ve 1,5 kat performans/vat güzelleştirmesi
  • TSMC’nin N6 süreç düğümünde üretilmiştir.

Intel’in grafik alanında gösterdiği uğraşların merkezinde, yazılıma öncelik veren bir yaklaşım bulunur:

  • Xe mimarisi, geliştiricilerle yakın işbirliği içinde tasarlanıyor ve sanayi standartlarına ahenk sağlıyor.
  • Intel’in birinci yüksek performanslı oyun grafik süreç ünitesi (GPU), entegre ve ayrık grafik eserlerini tek birleştirilmiş kod tabanında bir ortaya getiren bir şoför dizaynıyla performans ve kaliteye öncelik verir.
  • Temel grafik şoför bileşenlerinin, bilhassa bellek idaresi ve derleyicinin yine mimarisini tamamlayan Intel, CPU’ya bağımlı oyunlar için %15 daha fazla (ve %80 seviyesinde) iş çıkarma yeteneği ve %25 daha âlâ oyun yükleme mühletleri sağlıyor.

XeSS

XeSS, yüksek performans ve yüksek kaliteli görseller sağlayan yeni bir çözünürlük yükseltme teknolojisi sunmak için Alchemist’in yerleşik XMX AI hızlandırmasından yararlanır.  Doğal yüksek çözünürlüklü imaj sürece kalitesine yakın imgeleri sentezlemek için derin öğrenmeyi kullanır. Oynanması için daha düşük kalite ayarları ya da daha düşük çözünürlükler gereken oyunlar, XeSS sayesinde daha yüksek kalite ayarlarında ve çözünürlüklerde akıcı bir formda çalışabilir.

  • XeSS, komşu piksellerden alt piksel detaylarını ve hareket dengelemeli evvelki pikselleri yine yapılandırarak çalışır.
  • Yine yapılandırma, yüksek performans ve kusursuz kalite sağlamak için eğitilmiş, 2 kata kadar performans artışı sunan nöral bir ağ tarafından gerçekleştirilir.
  • XeSS; DP4a yönerge kümesinden yararlanır ve entegre grafik donanımını da içeren geniş bir donanım setinde, AI tabanlı harika örnekleme sunar.
  • Birçok oyun geliştiricisi, XeSS ile ilgilenirken; birinci XMX versiyonu için SDK, ISV’ler için bu ay, DP4a versiyonu ise bu yılın ilerleyen periyotlarında çıkacak.

Gelecek Jenerasyon Intel Xeon Ölçeklenebilir İşlemci (kod ismi: “Sapphire Rapids”)

Sapphire Rapids, Intel’in en büyük bilgi merkezi platformu gelişimini temsil ediyor. Dinamik ve giderek daha talepkâr hale gelen data merkezi kullanımlarında sağlam bilgi süreç performansı sağlayan işlemci; bulut, mikro hizmetler ve AI üzere elastik bilgi süreç modellerinde yüksek performans sağlayacak biçimde, iş yükü için optimize edilmiştir.

Sapphire Rapids’in merkezinde; monolitik bir CPU arabiriminin faydalarını koruma ederken büyük ölçeklenebilirlik sunmak için Intel’in gömülü çoklu kalıp arabağlantı köprüsü (EMIB) paketleme teknolojisinden yararlanan; karolu, modüler bir SoC mimarisi bulunmaktadır. Sapphire Rapids, her iş parçacığının önbellekler, bellek ve I/O dahil tüm karolardaki tüm kaynaklara tam erişiminin bulunduğu, tek istikrarlı bir birleşik bellek erişimi mimarisi sağlar. Sonuçta, tüm SoC genelinde dengeli düşük gecikme ve yüksek kesitli bant genişliğine ulaşır.

Intel 7 süreç teknolojisi üzerine şurası olan Sapphire Rapids; sürat için tasarlanan ve düşük gecikmenin ve tek iş parçacıklı uygulama performansının sonlarını zorlayan, Intel’in yeni Performance çekirdek mikromimarisini kullanır.

Neredeyse tüm müşteri yüklerinde ve kullanımlarda performansı artırmayı amaçlayan Sapphire Rapids; yeni yönerge seti mimarisi ve entegre IP üzere, sanayinin, data merkezi alanındaki en geniş yelpazeli hızlandırıcılarını bir ortaya getirir. Yeni yerleşik hızlandırma altyapıları, şunları içerir:

  • Intel® Accelerator Interfacing Architecture (AIA) – Hızlandırıcılar ve aygıtlara verimli dağıtımı, senkronizasyon ve işaretlemeyi takviyeler.
  • Intel Advanced Matrix Extensions (AMX) – Sapphire Rapids’in getirdiği; derin öğrenme algoritmalarının merkezinde bulunan tensör işlemede büyük bir sürat artışı sağlayan yeni bir hızlandırma altyapısı. Döngü başına 2K INT8 ve 1K BFP16 işletimle bilgi süreç yeteneklerinde artış sağlayabilir. Sapphire Rapids silikon kullanan optimize dahili matris çarpma mikro referans noktaları; Intel AMX yönerge kümesi uzantıları sayesinde, Intel AVX-512 VNNI yönergeler kullanan birebir mikro referans noktası versiyonuna kıyasla 7 kat daha süratli çalışır ve hem eğitim hem de çıkarım için AI iş yüklerinde büyük performans çıkarları sağlar.
  • Intel® Veri Streaming Accelerator (DSA) – Bilgi merkezi ölçekli dağıtımlarda görülen ek yüke neden olan en yaygın bilgi hareketi misyonlarını boşaltmak için tasarlanmıştır. Intel DSA, daha yüksek genel iş yükü performansı sağlamak için bu ek yük vazifelerinin işlenmesini güzelleştirir ve dataları; CPU, bellek ve önbellekler, tüm iliştirilmiş bellek, depolama ve ağ aygıtları ortasında taşıyabilir.

Bu mimari ilerlemeler sayesinde Sapphire Rapids; bulut, bilgi merkezi, ağ ve akıllı uçta en geniş iş yükleri ve dağıtım modelleri için kusursuz ve alışılmadık bir performans sunar.

İşlemci; PCIe 5.0, CXL 1.1, DDR5 ve HBM teknolojilerini de içeren yeni kuşak I/O ve ileri bellek ile sanayi teknoloji geçişlerini yönlendirmek için tasarlanmıştır.

Altyapı Süreç Ünitesi (IPU)

IPU, bulut ve bağlantı hizmeti sağlayıcılarının ek yükü azaltmasını ve CPU’ların performansını artırmasını sağlamak için tasarlanmış programlanabilir bir ağ aygıtıdır.

Intel’in IPU tabanlı mimarisinin birçok değerli avantajı vardır:

  • Altyapı fonksiyonları ile kiracı iş yükünün güçlü bir halde ayrılması, kiracıların CPU üzerinde tam denetim kazanmasına imkan tanır;
  • Bulut operatörü, altyapı misyonlarını IPU’ya taşıyarak CPU kullanımı ve geliri en üst düzeye çıkarabilir;
  • IPU’lar depolama trafiğini yönetebilir ve bu sayede, depolama kapasitesi disksiz bir sunucu mimarisi aracılığıyla verimli bir formda kullanılırken gecikme azalır. Müşteriler IPU sayesinde; süreç ve depolamayı dengelemelerini sağlayan inançlı, programlanabilir ve istikrarlı bir tahlille kaynakları daha uygun kullanabilir.

“Aynı model herkese uygun değildir” mottosunu benimseyen Intel, IPU mimarisine daha derin bir bakış getirdi ve IPU ailesinin, çeşitli ve dağınık bilgi merkezlerinin karmaşıklığını gidermek için tasarlanan aşağıdaki yeni üyelerini tanıttı.

Mount Evans, Intel’in birinci ASIC IPU’sudur. Mimarisi en kıymetli bulut hizmeti sağlayıcılarından biriyle birlikte tasarlanan ve geliştirilen Mount Evans, birden fazla FGPA SmartNIC kuşağından öğrenmeleri birleştirir.

  • Hiper ölçeğe hazırdır ve üst seviyede denetim sağlarken yüksek performanslı ağ ve depolama sanallaştırma fonksiyonları boşaltması sunar.
  • Güvenlik duvarları ve sanal yönlendirme üzere kullanım durumlarını mümkün kılan, sınıfının en yeterlisi programlanabilir paket sürece motorunu sağlar.
  • NVMe aygıtlara denk olmak ve onları aşmak için; Intel Optane teknolojisinden yükseltilen, donanım hızlandırmalı NVMe depolama arabirimi uygular.
  • İleri kripto ve sıkıştırma hızlandırma uygulayarak yüksek performanslı Intel® Quick Assist teknolojisini güçlendirir.
  • DPDK ve SPDK üzere yaygın olarak kullanılan yazılım ortamlarını kullanarak programlanabilir ve süreç çizgisi, Intel’in Barefoot Anahtar Ünitesi’nin öncülüğünü yaptığı P4 programlama lisanı kullanılarak yapılandırılabilir.

Oak Springs Canyon; Intel® Xeon-D  ve güç, verimlilik ve performans açısından sanayinin başkan FGPA’i olan Intel® AgilexTM FPGA ile aşağıdakiler için oluşturulmuş bir IPU referans platformudur:

  • Açık sanal anahtar (OVS) üzere ağ sanallaştırma fonksiyonlarını ve Yapı üzerinde NVMe ve RoCE v2 üzere depolama fonksiyonlarını boşaltmak ve daha inançlı, yüksek süratli 2×100 gigabit Ethernet ağı arabirimi sağlayan sertleştirilmiş bir kripto bloğu sağlamak;
  • Intel ortakları ve müşterilerinin; ölçeklendirilebilir, kaynağı erişilebilir bir yazılım ve donanım altyapısı olan Intel Open FPGA Stack ile tahlillerini özelleştirmelerini sağlamak.
  • x86’da optimize edilmiş olan DPDK ve SPDK üzere mevcut, yaygın olarak kullanılan yazılım ortamları kullanarak programlanmak.

Kod ismi “Arrow Creek” olan Intel N6000 Acceleration Development Platform, Xeon tabanlı sunucularla kullanım için tasarlanan bir SmartNIC’dir. Özellikleri:

  • Güç, verimlilik ve performans açısından sanayinin başkan FGPA’i olan Intel’in Agilex FPGA’i; yüksek performanslı 100 gigabit ağ hızlandırma için Intel Ethernet 800 Serisi Denetleyici;
  • Dünyanın en değerli irtibat hizmet sağlayıcılarının (CoSP’ler) kimilerinde kullanılmakta olan Intel PAC-N3000’in muvaffakiyetini temel alan; CoSP’lerin Juniper Contrail, OVS ve SRv6 üzere esnek hızlandırılmış iş yükleri sunmasını sağlayan, çeşitli altyapı iş yükleri için dayanak.

Xe HPC ve Ponte Vecchio

Xe HPC mikromimarisini kullanan Ponte Vecchio; AI, yüksek performanslı bilgi süreç (HPC) ve ileri tahlil iş yüklerini hızlandırmak için, sanayi önderi FLOP’lar ve bilgi süreç yoğunluğu sunar. Xe HPC mikromimarisinin IP bloğuna dair detayları açıklayan Intel; Xe-core başına sekiz Vector ve Matrix altyapısı (XMX – Xe Matris eXtensions olarak anılır), dilim ve yığın bilgisi ve Compute, Base ve Xe karoları için süreç düğümleri üzere bilgiler verdi. Mimari Günü’nde; Intel, Ponte Vecchio silikonun tanınan bir AI kıyaslamasında şimdiden başkan performans gösterdiğini ve sanayide, hem çıkarım hem de eğitim iş çıkarma rekoru kırdığını gösterdi.1 Intel’in A0 silikonu, 45 TFLOPS FP32’dan daha fazla iş çıkarma yeteneği, 5 TBps’tan yüksek bellek yapısı bant genişliği ve 2 TBps’tan fazla bağlanabilirlik bant genişliği sağlıyor. Intel, her ikisi de performans liderliği sağlama yolunda ilerleyen saniyede 43.000 manzaranın üzerindeki ResNet çıkarım performansı ve saniyede 3.400 imgeden daha fazla ResNet eğitimini gösteren bir demoyu da paylaştı.1

Ponte Vecchio, kendini karolar halinde gösteren ve karolar ortasında düşük güçle yüksek süratli bir irtibat sağlayan bir EMIB karosu aracılığıyla monte edilen çeşitli karmaşık dizaynlardan oluşuyor. Tüm bu dizaynlar; güç ve orta ilişki yoğunluğu için, faal silikonun 3D yığınlamasını oluşturan Foveros pakette bir ortaya getiriliyor. Yüksek süratli bir MDFI orta kontağı, bir yığından iki yığına ölçeklemeye imkan tanıyor.

Bilgi Süreç Karosu, ağır bir Xe çekirdekleri paketi ve Ponte Vecchio’nun kalbidir.

  • Bir karonun, bilgi süreci güç verimliliğiyle sağlamanın anahtarı olan toplam 4MB L1 önbellekli sekiz Xe çekirdeği bulunuyor.

TSMC’nin en ileri süreç teknolojisi olan N5’te oluşturuldu.

  • Intel; tasarım altyapısı suramı, araç akışları ve bu düğüm için karoları test edebilecek ve doğrulayabilecek metodoloji ile yeri hazırladı.
  • Karoda, Foveros ile 3D yığınlama için son derece sıkı bir 36-mikron “bump pitch” vardır

Temel Karosu, Ponte Vecchio’nun bağ dokusudur. Foveros teknolojisi için optimize edilen Intel 7 ile oluşturulan büyük bir kalıptır.

  • Temel Karosu, tüm karmaşık I/O ve yüksek bant genişliği bileşenlerinin SoC altyapısı -PCIe Gen5, HBM2e bellek, karo-karo ve EMIB köprülerini bağlamak için MDFI bağlantıları- ile bir ortaya geldiği yerdir
  • Yüksek 2D arabağlantılı ve düşük gecikmeli muhteşem yüksek bant genişlikli 3D irtibat sayesinde, sonsuz bir bağlanabilirlik makinesi haline gelir.
  • Intel teknoloji geliştirme takımı; bant genişliği, “bump pitch” ve sinyal bütünlüğü ihtiyaçlarını karşılamak için çalıştı.

Xe Temas Karosu, karo başına sekiz ilişkiyi destekleyen GPU’lar ortasında bağlanabilirliği sağlar.

  • HPC ve AI için ölçek yükseltmede kritiktir.
  • Intel’de desteklenen en süratli SerDes’i gayeler – 90G’e kadar.
  • Bu karo, Aurora Exascale muhteşem bilgisayar için ölçek yükseltme tahlilini sağlamak üzere eklendi.

Ponte Vecchio; açık, geçerlik sınamasında ve hudutlu sayıda müşteri tarafından denenmeye başladı. Ponte Vecchio, HPC ve AI pazarları için 2022 yılında piyasaya çıkarılacak.

oneAPI

oneAPI sanayi inisiyatifi; açık, standartlara dayalı birleşik bir yazılım yığını sağlar. Tüm mimariler ve satıcılara yönelik bu yığın, geliştiricilerin şirketlere ilişkin tescilli lisanlar ve programlama modellerinden kurtulmasına imkan tanır. Şu anda Nvidia GPU’lar, AMD GPU’lar ve Arm CPU’lar için Veri Parallel C++ (DPC++) ve oneAPI kitaplık uygulamaları vardır. oneAPI; bağımsız yazılım satıcıları (ISV’ler), işletim sistemi satıcıları, son kullanıcılar ve akademisyenler tarafından geniş çapta benimsenmektedir. Değerli sanayi önderleri; özellikleri, ek kullanım durumları ve mimarileri destekleyecek formda geliştirmeye yardım ediyor. Intel’in; makul lisan ve kitaplıkların ötesinde derleyiciler, çözümleyiciler, yanılgı ayıklayıcılar ve taşıma ayarları ekleyen temel oneAPI temel araç setini içeren ticari bir eseri de bulunuyor.

oneAPI, mimariler ortasında uyumluluk sağlayarak geliştirici üretkenliğini ve inovasyonu güzelleştirir:

  • Intel’in oneAPI araç kadrolarının, 200.000’den fazla eşsiz yüklemesi vardır;
  • 300’ü aşkın uygulama, piyasada oneAPI’ın birleşik programlama modelini kullanıyor;
  • Intel oneAPI Toolkits’i kullanan Xe HPC mikromimaride, 80’den fazla HPC ve AI uygulaması fonksiyoneldir;
  • Süreksiz versiyon 1.1’ın Mayıs ayında piyasaya çıkarılan özellikleri, derin öğrenme iş yükleri için yeni grafik arabirimleri ve ileri ışın izleme kitaplıkları sağlıyor ve yıl sonuna kadar tamamlanması bekleniyor.

Yorum yapın