کمپانی انویدیا در مراسم GTC 2016 خودش مشخصات کامل تراشه گرافیکی نسل بعدش را منتشر کرد. این تراشه که به اصطلاح Big Pascal یا پاسکال بزرگ نام گذاری شده شامل تراشه قدرتمند Pascal GP100 با ۳۸۴۰ هسته کودا است که از معماری کاملاً متفاوتی استفاده میکند. با وجود پاسکال «Pascal» هر Streaming Multiprocessor ای از ۶۴ هسته کودا «CUDA» بهره مند شده که این مقدار در معماری ماکسول «Maxwell» معادل ۱۲۸ عدد بود. یعنی ۶۰ واحد SMx در Pascal GP100 که در کل ۳۸۴۰ هسته کودا را تشکیل میدهد.
هر SM در این واحدها از ۴ عدد TMU «معادل Texture Mapping Unit» یا همان واحد ترسیم بافت استفاده میکند که جمعاً به ۲۴۰ واحد TMU میرسد. از طرفی در این تراشه هر SM از دو برابر دستورالعمل های FP32 بیشتری به نسبت FP64 استفاده میکند. این بدین معناست که عملکرد FP64 در این معماری بسیار بیشتر از همین دستورات در دو معماری پیشین کپلر و ماکسول است. انویدیا Pascal GP100 با لیتورگرافی ۱۶nm Fin-FET طراحی شده و از ۱۶ گیگابایت حافظه HBM2 استفاده میکند.
همچنین پردازنده از ۸ گذرگاه کنترلر حافظه ۵۱۲ بیتی استفاده میکند که در مجموع پهنای باند عظیمی معادل ۴۰۹۶ بیت را در اختیار پردازنده قرار میدهد. حداکثر پهنیا باند قال استفاده هم ۷۲۰ گیگابایت گزارش شده است. البته در این مورد اطلاعاتی در دست نیست و هنوز بلاگ های منتسب به انویدیا توضیحی در این مورد ارائه نداده اند. البته لازم به ذکر است در کنار انویدیا Pascal GP100 تراشه انویدیا Tesla P100 هم معرفی شده که یک تراشه کامل به شمار نمیرود.
مقایسه مشخصات انویدیا Pascal GP100 با معماری های پیشین
نام تراشه گرافیکی | کپلر GK110 | ماکسول GM200 | پاسکال GP100 |
---|---|---|---|
قابلیت محاسبه | ۳.۵ | ۵.۳ | ۶.۰ |
Threads / Warp | ۳۲ | ۳۲ | ۳۲ |
Max Warps / Multiprocessor | ۶۴ | ۶۴ | ۶۴ |
Max Threads / Multiprocessor | ۲۰۴۸ | ۲۰۴۸ | ۲۰۴۸ |
Max Thread Blocks / Multiprocessor | ۱۶ | ۳۲ | ۳۲ |
Max 32-bit Registers / SM | ۶۵۵۳۶ | ۶۵۵۳۶ | ۶۵۵۳۶ |
Max Registers / Block | ۶۵۵۳۶ | ۳۲۷۶۸ | ۶۵۵۳۶ |
Max Registers / Thread | ۲۵۵ | ۲۵۵ | ۲۵۵ |
Max Thread Block Size | ۱۰۲۴ | ۱۰۲۴ | ۱۰۲۴ |
CUDA Cores / SM | ۱۹۲ | ۱۲۸ | ۶۴ |
Shared Memory Size / SM | ۱۶K/32K/48K | ۹۶K | ۶۴K |
مهمترین ویژگی های کلیدی انویدیا Pascal GP100 به شرح زیر است:
- برق رسانی، ععملکرد بهینه شده و بسیار بهتر و قدرت پردازشی بالاتر
- استفاده از فناوری جدید انویدیا NVLink برای ارائه پهنای باند بالا
- استفاده از حافظه HBM2 با پهنای باند بالا و ظرفیت بسیار زیاد
- استفاده از حافظه های یکپارچه موجب میشود مدل برنامه نویسی برای این کارت ها به طور قابل توجهی بهبود پیدا کنند.
- استفاده از فناوری ساخت ۱۶nm FinFET موجب میشود ویژگی های زیادی نصیب این کارت شود. افزایش عملکرد هسته ها و بهبود بهره وری قدرت «power efficiency» دو مورد مهمی است که انویدیا Pascal GP100 را از دو معماری پیشین متمایز میکند.
مشخصات انویدیا Pascal GP100
تولیدات تسلا | تسلا K40 | تسلا M40 | تسلا P100 |
---|---|---|---|
نام تراشه گرافیکی | GK110-Kepler | GM200-Maxwell | GP100-Pascal |
تعداد SM ها | ۱۵ | ۲۴ | ۵۶ |
تعداد TPC ها | ۱۵ | ۲۴ | ۲۸ |
FP32 CUDA Cores / SM | ۱۹۲ | ۱۶۸ | ۶۴ |
FP32 CUDA Cores / GPU | ۲۸۸۰ | ۳۰۷۲ | ۳۵۸۴ |
FP64 CUDA Cores / SM | ۶۴ | ۴ | ۳۲ |
FP64 CUDA Cores / GPU | ۹۶۰ | ۹۶ | ۱۷۹۲ |
کلاک پایه | ۷۴۵ MHz | ۹۴۸ MHz | ۱۳۲۸ MHz |
کلاک بوست | ۸۱۰/۸۷۵ MHz | ۱۱۱۴ MHz | ۱۴۸۰ MHz |
FP64 GFLOPs | ۱۶۸۰ | ۲۱۳ | ۵۳۰۴ |
Texture Units | ۲۴۰ | ۱۹۲ | ۲۲۴ |
Memory Interface | ۳۸۴ بیت GDDR5 | ۳۸۴ بیت GDDR5 | ۴۰۹۶ بیت HBM2 |
انندازه حافظه | تا ۱۲ گیگابایت | تا ۲۴ گیگابایت | ۱۶ گیگابایت |
اندازه کش L2 | ۱۵۳۶ کیلوبایت | ۳۰۷۲ کیلوبایت | ۴۰۹۶ کیلوبایت |
Register File Size / SM | ۲۵۶ کیلوبایت | ۲۵۶ کیلوبایت | ۲۵۶ کیلوبایت |
Register File Size / GPU | ۳۸۴۰ کیلوبایت | ۶۱۴۴ کیلوبایت | ۱۴۳۳۶ کیلوبایت |
TDP | ۲۳۵ وات | ۲۵۰ وات | ۳۰۰ وات |
ترانزیستور | ۷.۱ بیلیون | ۸ بیلیون | ۱۵.۳ بیلیون |
ابعاد GPU Die | ۵۵۱ mm² | ۶۰۱ mm² | ۶۱۰ mm² |
فرآیند تولید | ۲۸ نانومتر | ۲۸ نانومتر | ۱۶ نانومتر |