کمپانی انویدیا در مراسم GTC 2016 خودش مشخصات کامل تراشه گرافیکی نسل بعدش را منتشر کرد. این تراشه که به اصطلاح Big Pascal یا پاسکال بزرگ نام گذاری شده شامل تراشه قدرتمند Pascal GP100 با ۳۸۴۰ هسته کودا است که از معماری کاملاً متفاوتی استفاده میکند. با وجود پاسکال «Pascal» هر Streaming Multiprocessor ای از ۶۴ هسته کودا «CUDA» بهره مند شده که این مقدار در معماری ماکسول «Maxwell» معادل ۱۲۸ عدد بود. یعنی ۶۰ واحد SMx در Pascal GP100 که در کل ۳۸۴۰ هسته کودا را تشکیل میدهد.
هر SM در این واحدها از ۴ عدد TMU «معادل Texture Mapping Unit» یا همان واحد ترسیم بافت استفاده میکند که جمعاً به ۲۴۰ واحد TMU میرسد. از طرفی در این تراشه هر SM از دو برابر دستورالعمل های FP32 بیشتری به نسبت FP64 استفاده میکند. این بدین معناست که عملکرد FP64 در این معماری بسیار بیشتر از همین دستورات در دو معماری پیشین کپلر و ماکسول است. انویدیا Pascal GP100 با لیتورگرافی ۱۶nm Fin-FET طراحی شده و از ۱۶ گیگابایت حافظه HBM2 استفاده میکند.
همچنین پردازنده از ۸ گذرگاه کنترلر حافظه ۵۱۲ بیتی استفاده میکند که در مجموع پهنای باند عظیمی معادل ۴۰۹۶ بیت را در اختیار پردازنده قرار میدهد. حداکثر پهنیا باند قال استفاده هم ۷۲۰ گیگابایت گزارش شده است. البته در این مورد اطلاعاتی در دست نیست و هنوز بلاگ های منتسب به انویدیا توضیحی در این مورد ارائه نداده اند. البته لازم به ذکر است در کنار انویدیا Pascal GP100 تراشه انویدیا Tesla P100 هم معرفی شده که یک تراشه کامل به شمار نمیرود.
نام تراشه گرافیکی | کپلر GK110 | ماکسول GM200 | پاسکال GP100 |
---|---|---|---|
قابلیت محاسبه | ۳.۵ | ۵.۳ | ۶.۰ |
Threads / Warp | ۳۲ | ۳۲ | ۳۲ |
Max Warps / Multiprocessor | ۶۴ | ۶۴ | ۶۴ |
Max Threads / Multiprocessor | ۲۰۴۸ | ۲۰۴۸ | ۲۰۴۸ |
Max Thread Blocks / Multiprocessor | ۱۶ | ۳۲ | ۳۲ |
Max 32-bit Registers / SM | ۶۵۵۳۶ | ۶۵۵۳۶ | ۶۵۵۳۶ |
Max Registers / Block | ۶۵۵۳۶ | ۳۲۷۶۸ | ۶۵۵۳۶ |
Max Registers / Thread | ۲۵۵ | ۲۵۵ | ۲۵۵ |
Max Thread Block Size | ۱۰۲۴ | ۱۰۲۴ | ۱۰۲۴ |
CUDA Cores / SM | ۱۹۲ | ۱۲۸ | ۶۴ |
Shared Memory Size / SM | ۱۶K/32K/48K | ۹۶K | ۶۴K |
مهمترین ویژگی های کلیدی انویدیا Pascal GP100 به شرح زیر است:
تولیدات تسلا | تسلا K40 | تسلا M40 | تسلا P100 |
---|---|---|---|
نام تراشه گرافیکی | GK110-Kepler | GM200-Maxwell | GP100-Pascal |
تعداد SM ها | ۱۵ | ۲۴ | ۵۶ |
تعداد TPC ها | ۱۵ | ۲۴ | ۲۸ |
FP32 CUDA Cores / SM | ۱۹۲ | ۱۶۸ | ۶۴ |
FP32 CUDA Cores / GPU | ۲۸۸۰ | ۳۰۷۲ | ۳۵۸۴ |
FP64 CUDA Cores / SM | ۶۴ | ۴ | ۳۲ |
FP64 CUDA Cores / GPU | ۹۶۰ | ۹۶ | ۱۷۹۲ |
کلاک پایه | ۷۴۵ MHz | ۹۴۸ MHz | ۱۳۲۸ MHz |
کلاک بوست | ۸۱۰/۸۷۵ MHz | ۱۱۱۴ MHz | ۱۴۸۰ MHz |
FP64 GFLOPs | ۱۶۸۰ | ۲۱۳ | ۵۳۰۴ |
Texture Units | ۲۴۰ | ۱۹۲ | ۲۲۴ |
Memory Interface | ۳۸۴ بیت GDDR5 | ۳۸۴ بیت GDDR5 | ۴۰۹۶ بیت HBM2 |
انندازه حافظه | تا ۱۲ گیگابایت | تا ۲۴ گیگابایت | ۱۶ گیگابایت |
اندازه کش L2 | ۱۵۳۶ کیلوبایت | ۳۰۷۲ کیلوبایت | ۴۰۹۶ کیلوبایت |
Register File Size / SM | ۲۵۶ کیلوبایت | ۲۵۶ کیلوبایت | ۲۵۶ کیلوبایت |
Register File Size / GPU | ۳۸۴۰ کیلوبایت | ۶۱۴۴ کیلوبایت | ۱۴۳۳۶ کیلوبایت |
TDP | ۲۳۵ وات | ۲۵۰ وات | ۳۰۰ وات |
ترانزیستور | ۷.۱ بیلیون | ۸ بیلیون | ۱۵.۳ بیلیون |
ابعاد GPU Die | ۵۵۱ mm² | ۶۰۱ mm² | ۶۱۰ mm² |
فرآیند تولید | ۲۸ نانومتر | ۲۸ نانومتر | ۱۶ نانومتر |
نوشته شده در Intel /Nvidia,اخبار,اخبار سخت افزار
تست و بررسی کامل کارت های گرافیکی GTX 970 & GTX 980با 13,743 بازديد
ناگفته های داستان بازی Metal Gear Solid V: The Phantom Painبا 13,493 بازديد
آیا PS4 هک شده؟! حاشیه های هک ۴ Playstationبا 13,358 بازديد
داستان کامل بازی Watch Dogsبا 13,123 بازديد