جزئیات سوپرچیپ انویدیا GB10 Blackwell با 20 هسته ARM و 6144 هسته CUDA شرح داده شد. در ادامه به بررسی این پردازنده میپردازیم.
بررسی جزئیات سوپرچیپ انویدیا GB10 Blackwell
سوپرچیپ GB10 Grace Blackwell یکی از مورد انتظارترین دستگاههای NVIDIA در سال جاری است، هرچند عرضه آن از پنجره زمانی وعده داده شده جولای به تأخیر افتاده است. بر روی کاغذ، معماری آن شبیه چیزی است که بسیاری انتظار دارند بعداً در سری N1، SoCهای ARM مصرفکننده-محور NVIDIA برای لپتاپها و بازیها، ظاهر شود.
یک سؤال رایج این است که آیا در این جزئیات سوپرچیپ انویدیا GB10 Blackwell از پشتیبانی Windows on ARM صحبتی شده است یا خیر. به طور رسمی، NVIDIA تنها پشتیبانی از DGX Base OS را لیست میکند که یک توزیع لینوکس بهینهسازیشده برای پشته نرمافزاری هوش مصنوعی این شرکت است.
در حالی که ممکن است از نظر فنی نصب توزیعهای لینوکس دیگر، یا حتی ویندوز، امکانپذیر باشد، هیچ تلاشی در این زمینه مستند نشده است، زیرا سختافزار هنوز عرضه نشده است (یا شده است؟). همین عدم قطعیت در مورد عملکرد نیز صدق میکند. NVIDIA بنچمارکهای واقعی را منتشر نکرده است، بنابراین هنوز مشخص نیست که این چیپ چگونه رابطهای گرافیکی را تحت DGX Base OS یا فراتر از آن مدیریت میکند.
در جزئیات سوپرچیپ انویدیا GB10 Blackwell این همکاری با MediaTek را موفق اعلام کرده است که یک تأیید مهم با توجه به سالها گمانهزنی در مورد توسعه SoC مشترک CPU–GPU است. این عرضه محدود در پلتفرم DGX Spark به NVIDIA اجازه میدهد تا یکپارچگی سیلیکون و نرمافزار را پیش از مقیاسبندی طراحی برای بازارهای گستردهتر، مانند مصرفکننده و بازی، تأیید کند.
از منظر فنی، GB10 بیست هسته CPU Arm v9.2 را که در دو خوشه 10 تایی سازماندهی شدهاند، یکپارچه میکند. هر هسته دارای کش L2 خصوصی است و هر خوشه دارای 16 مگابایت کش L3 مشترک است، برای مجموع 32 مگابایت. این SoC از یک پکیج dual-dielet 2.5D بر روی فرآیند N3 شرکت TSMC استفاده میکند: S-dielet برای CPU و حافظه، و G-dielet برای GPU.
این چیپ دارای TDP 140 وات است. GPU بر اساس معماری Blackwell است، و جالب اینجاست که NVIDIA تعداد هسته CUDA را در اینجا ذکر نمیکند. آنچه که ذکر میکنند این است که این چیپ هستههای Tensor نسل پنجم، هستههای ری تریسینگ RTX و پشتیبانی از DLSS 4 را یکپارچه میکند. حداکثر توان عملیاتی به 31 ترافلاپس FP32 و تا 1000TOPS از محاسبات FP4 میرسد. GPU همچنین دارای 24 مگابایت کش L2 اضافی است.
در جزئیات سوپرچیپ انویدیا GB10 Blackwell آمده است که حافظه از طریق یک رابط 256 بیتی LPDDR5X-9400 در معماری حافظه یکپارچه فراهم میشود. با ظرفیت تا 128 گیگابایت، سیستم به پهنای باند خام 301 گیگابایت بر ثانیه میرسد، با پهنای باند تجمیعی 600 گیگابایت بر ثانیه که از طریق رابط C2C NVLINK کممصرف NVIDIA برای هر دو CPU و GPU قابل دسترسی است. این چیپ همچنین دارای 16 مگابایت کش سطح سیستم (L4) است تا اشتراکگذاری داده کارآمد را در میان موتورها ممکن سازد.
اتصالپذیری شامل PCIe Gen5، USB، اترنت از طریق PCIe و پشتیبانی از چهار نمایشگر همزمان (سه DP + یک HDMI) است. خروجیهای نمایشگر تا 4K 120 هرتز را از طریق DP Alt Mode و تا 8K 120 هرتز را با HDMI 2.1a پشتیبانی میکنند. ویژگیهای امنیتی شامل دو ریشه امن، پردازندههای اختصاصی SROOT و OSROOT، و پشتیبانی از fTPM و TPM مجزا است.
اگرچه DGX Spark به عنوان یک کامپیوتر مصرفکننده طراحی نشده است، فرم فاکتور فشرده، حافظه یکپارچه و بستهبندی چند قالبی آن، فناوریهایی را به نمایش میگذارد که احتمالاً به SoCهای مصرفکننده N1 آینده NVIDIA منتقل خواهند شد. GB10 پلی است بین شتابدهندههای Blackwell در سطح مرکز داده و دستگاههای مصرفکننده نهایی، و پیشنمایش اولیه از آنچه که نقشه راه محاسبات مبتنی بر ARM انویدیا برای دسکتاپها و لپتاپها به ارمغان خواهد آورد، ارائه میدهد.
نظرات کاربران