مشخصات انویدیا Pascal GP100 با ۳۸۴۰ هسته کودا معرفی شد

مشخصات-انویدیا-Pascal-GP100

مشخصات-انویدیا-Pascal-GP100

کمپانی انویدیا در مراسم GTC 2016 خودش مشخصات کامل تراشه گرافیکی نسل بعدش را منتشر کرد. این تراشه که به اصطلاح Big Pascal یا پاسکال بزرگ نام گذاری شده شامل تراشه قدرتمند Pascal GP100 با ۳۸۴۰ هسته کودا است که از معماری کاملاً متفاوتی استفاده میکند. با وجود پاسکال «Pascal» هر Streaming Multiprocessor ای از ۶۴ هسته کودا «CUDA» بهره مند شده که این مقدار در معماری ماکسول «Maxwell» معادل ۱۲۸ عدد بود. یعنی ۶۰ واحد SMx در Pascal GP100 که در کل ۳۸۴۰ هسته کودا را تشکیل میدهد.

هر SM در این واحدها از ۴ عدد TMU «معادل Texture Mapping Unit» یا همان واحد ترسیم بافت استفاده میکند که جمعاً به ۲۴۰ واحد TMU میرسد. از طرفی در این تراشه هر SM از دو برابر دستورالعمل های FP32 بیشتری به نسبت FP64 استفاده میکند. این بدین معناست که عملکرد FP64 در این معماری بسیار بیشتر از همین دستورات در دو معماری پیشین کپلر و ماکسول است. انویدیا Pascal GP100 با لیتورگرافی ۱۶nm Fin-FET طراحی شده و از ۱۶ گیگابایت حافظه HBM2 استفاده میکند.

همچنین پردازنده از ۸ گذرگاه کنترلر حافظه ۵۱۲ بیتی استفاده میکند که در مجموع پهنای باند عظیمی معادل ۴۰۹۶ بیت را در اختیار پردازنده قرار میدهد. حداکثر پهنیا باند قال استفاده هم ۷۲۰ گیگابایت گزارش شده است. البته در این مورد اطلاعاتی در دست نیست و هنوز بلاگ های منتسب به انویدیا توضیحی در این مورد ارائه نداده اند. البته لازم به ذکر است در کنار انویدیا Pascal GP100 تراشه انویدیا Tesla P100 هم معرفی شده که یک تراشه کامل به شمار نمیرود.

مقایسه مشخصات انویدیا Pascal GP100 با معماری های پیشین

نام تراشه گرافیکیکپلر GK110ماکسول GM200پاسکال GP100
قابلیت محاسبه۳.۵۵.۳۶.۰
Threads / Warp۳۲۳۲۳۲
Max Warps / Multiprocessor۶۴۶۴۶۴
Max Threads / Multiprocessor۲۰۴۸۲۰۴۸۲۰۴۸
Max Thread Blocks / Multiprocessor۱۶۳۲۳۲
Max 32-bit Registers / SM۶۵۵۳۶۶۵۵۳۶۶۵۵۳۶
Max Registers / Block۶۵۵۳۶۳۲۷۶۸۶۵۵۳۶
Max Registers / Thread۲۵۵۲۵۵۲۵۵
Max Thread Block Size۱۰۲۴ ۱۰۲۴ ۱۰۲۴
CUDA Cores / SM۱۹۲۱۲۸۶۴
Shared Memory Size / SM ۱۶K/32K/48K ۹۶K۶۴K

مهمترین ویژگی های کلیدی انویدیا Pascal GP100 به شرح زیر است:

مشخصات انویدیا Pascal GP100

تولیدات تسلا تسلا K40تسلا M40تسلا P100
نام تراشه گرافیکیGK110-KeplerGM200-MaxwellGP100-Pascal
تعداد SM ها۱۵۲۴۵۶
تعداد TPC ها۱۵۲۴۲۸
FP32 CUDA Cores / SM۱۹۲۱۶۸۶۴
FP32 CUDA Cores / GPU۲۸۸۰۳۰۷۲۳۵۸۴
FP64 CUDA Cores / SM۶۴۴۳۲
FP64 CUDA Cores / GPU۹۶۰۹۶۱۷۹۲
کلاک پایه۷۴۵ MHz۹۴۸ MHz۱۳۲۸ MHz
کلاک بوست۸۱۰/۸۷۵ MHz ۱۱۱۴ MHz۱۴۸۰ MHz
FP64 GFLOPs۱۶۸۰۲۱۳۵۳۰۴
Texture Units۲۴۰۱۹۲۲۲۴
Memory Interface۳۸۴ بیت GDDR5۳۸۴ بیت GDDR5۴۰۹۶ بیت HBM2
انندازه حافظهتا ۱۲ گیگابایتتا ۲۴ گیگابایت۱۶ گیگابایت
اندازه کش L2۱۵۳۶ کیلوبایت۳۰۷۲ کیلوبایت۴۰۹۶ کیلوبایت
Register File Size / SM۲۵۶ کیلوبایت۲۵۶ کیلوبایت۲۵۶ کیلوبایت
Register File Size / GPU۳۸۴۰ کیلوبایت۶۱۴۴ کیلوبایت۱۴۳۳۶ کیلوبایت
TDP۲۳۵ وات۲۵۰ وات۳۰۰ وات
ترانزیستور۷.۱ بیلیون۸ بیلیون۱۵.۳ بیلیون
ابعاد GPU Die ۵۵۱ mm²۶۰۱ mm²۶۱۰ mm²
فرآیند تولید۲۸ نانومتر۲۸ نانومتر۱۶ نانومتر
خروج از نسخه موبایل