دیدار مجدد با پاسکال «Pascal»
تراشه انویدیا پاسکال GP104 همچون تراشه قدرتمند Pascal GP100 میتواند در کارت های سری Quadro مورد استفاده قرار بگیرد و این تراشه را احتمالاً میتوان یکی از مهمترین تراشه های امسال انویدیا دانست. تراشه های که احتمالاً از حافظه های GDDR5 و دو سوم هسته های کودای Pascal GP100 استفاده میکند. البته با توجه به ابعاد ویفر «Die» این تراشه که ۵۰-۴۰۰ میلیمتر مربع است، شاید بتوانیم ۱۰ بیلیون ترانزیستور ار در آن ببینیم. ویفر «Die» این تراشه به این دلیل کوچک است که به حافظه رابط کنترلر Pascal GP100 نیازی ندارد. با این حال برخی محاسبات نشان میدهد ویفر «Die» این تراشه از مساحتی معادل ۴۰۰ میلیمتر مربع برخوردار میشد.
بنابراین احتمال میرود تعداد هسته های کودای این تراشه ۲۵۶۰ عدد باشد و شاید بتوان GP104 را در یکی از پرچمداران نسل بعدی انویدیا مثل GTX 1080/1800 و یا GTX 1070/1700 مشاهده کرد. با این حال مقدار ۲۵۶۰ هسته کودا باز هم بسیار فراتر از ۲۰۴۸ عدد هسته موجود در Maxwell GM206 است. مدل GP104-200 جزو بهترین تراشه های گرافیکی نسل بعد انویدیا است که قرار است در اولین حضورش در کارت گرافیک GeForce GTX 1070 مورد استفاده قرار بگیرد.
تراشه ای که در زیر مشاهده میکنید احتمالاً برای استفاده در سری کارت های GeForce GTX 1070 مورد استفاده قرار خواهد گرفت، هر چند که این یک نسخه برش یافته از GP104-400 است، ولی به نظر میرسد همان چیزی است که پیشتر در دو مطلب «با اولین نسل از تراشه های گرافیکی پاسکال آشنا شوید» و «آنالیز اولیه تراشه های گرافیکی نسل بعد انویدیا پاسکال» به آن اشاره کرده بودیم. تنها تفاوت موجود بین چیزی که در تصویر زیر میبینید با مطلب قبلی در اصلاح پیکربندی تراشه گرافیکی «GPU» زیر است. این تصویر با کیفیت از تراشه گرافیکی GP104-400 انویدیا مبتنی بر معماری پاسکال میباشد که منتشر شده است.
[su_note note_color=”#f5f7f7″]با تراشه گرافیکی پاسکال «PASCAL» آشنا شوید[/su_note]
بنابراین احتمال استفاده از تراشه تصویر بالا در کارت های آینده انویدیا GeForce GTX 1070 میتواند امری محتمل به نظر برسد. با مقایسه عملکرد دو تراشه «GM200 و GM204» نسل دوم معماری ماکسول «Maxwell» به این نتیجه میرسیم که مساحت تراشه انویدیا پاسکال GP104 از دو تراشه فوق کوچکتر است. با اینحال، به دلیل فناوری ساخت پایین تر از منظر دو فاکتور «عملکرد» و «بهره وری» از دو تراشه فوق بهتر و قوی تر است. این همان حالتی است که در سری قبل (معماری ماکسول) به نسبت سری کپلر شاهدش بودیم.
به نگاهی به گذشته متوجه میشویم که دو کارت GTX 970 و GTX 980 مبتنی بر نسل دوم معماری ماکسول «Maxwell» از نظر عملکرد حداقل بر روی کاغد به نسبت گل سرسبد نسل قبلش یعنی GTX 780 TI ضعیف تر به نظر میرسید. در واقع کارتی مثل GTX 980 در نسل قبل به نسبت GTX 780 TI از ۳۳% پهنای باند کمتر، ۳۰% شیدر کمتر و تعداد ترانزیستورهای کمتری استفاده میکرد، با این حال بین ۵ تا ۹ درصد قویتر از GTX 780 TI بود و از سطح عملرکد و میزان بهره وری بسیاربالایی استفاده میکرد که حاصل نسل دوم معماری ماکسول «Maxwell» بود.
این روش، همان چیزی است که انویدیا در سری پاسکال هم به دنبالش است. یعنی تراشه ای با ابعاد مساحت کمتر و قدرت و بهره وری بیشتر. مساحت GP104-400 فقط ۳۳۳ میلیمتر مربع است و گفته میشود با همین ابعاد احتمالاً ۱۰.۲ بیلیون ترانزیستور، ۴۰ واحد SM و ۲۵۰۰ هسته کودا «CUDA» استفاده میکند که به نسبت تراشه های رده بالای GM204 رقم بالایی محسوب میشود. GM204 فقط از ۴ کلاستر «Clusters» تشکیل شده بود که به آنها Graphics Processing Clusters یا به صورت مخفف GPC گفته میشود.
کلاسترها مربع های سبزی رنگی هستند که درونشان مستطیل های سبز رنگ کوچکتری قرار دارند که به SM یا «Streaming Multiprocessors» معروف اند و مجموع این SM ها در تراشه GP104-400 معادل ۲۵۶۰ هسته کودا (CUDA) یا همان هسته های سایه زن «Shader Core» است. بنابراین دیاگرام اصلی تراشه نسل قبل حفظ شده و تغییرات اصلی در هسته های Shader رخ داده که نتیجه نهایی را رقم میزند. اما برای تخمین اندازه مساحت ویفر «Die» تراشه GP104-400، اول پیکسل ها را شمارش میکنیم و سپس از GM204 نیز به عنوان واحد کنترل استفاده میکنیم.
نتیجه این محاسبات نشان میدهد مساحت GP104-400 فقط ۳۳۳ میلیمتر مربع است و همانطور که در بالا اشاره کردیم از دو تراشه «GM200 و GM204» کوچیکتر میباشد. البته به تازگی تصاویری از همان تراشه GP104-400 نصب شده بر روی یک PCB منتشر شده که هنوز صحتش تایید نشده است. این تصویر را در زیر مشاهده میکنید و همانطور که میبینید از کیفیت مناسبی بر خوردار نیست و مشخص نیست خود تراشه GP104-400 است یه خیر.
البته شایعات جدید نشان میدهد که کمپانی MSI اولین کارت گرافیک سفارشی شده مبتنی بر معماری پاسکال خودش را با نام MSI GeForce GTX 1080 GAMING 8G عرضه میکند. این شایعات مربوط به دو سایت videocardz و wccftech است که هر دوی آنها مدعی هستند تصاویری که در زیر مشاهده میکنید از بُرد «PCB» مرجع دو کارت GTX1080 و GTX1070 بدست آمده است. هنوز صحت تصاویر فوق تایید یا تکذیب نشده، با این حال و طبق خبرهای گذشته، احتمال استفاده از حافظه های ساخت سامسونگ در این کارت ها منطقی تر به نظر میرسد که وجود حافظه هایی با برند میکرون «Micron» معادلات را بهم ریخت.
تصویر بالا که ادعا میشد جدیدترین کارت گرافیک پاسکال است، مربوط به GTX 980 نسخه ۴ گیگ بود که در نقاط مشخص شده اختلافات فاحشی با سطح ویفر «Die» تراشه انویدیا پاسکال دارد. اما بلافاصله تصویر دومی که در زیر میبینید منتشر شد و تمام معادلات را بهم زد. تصویر تایید نشده ای که ادعا میشوید مربوط به کارت گرافیک MSI GeForce GTX 1080 GAMING 8G است و از تراشه GP104-400-A1 به عنوان قلب تپنده خودش استفاده میکند.
نکته قابل توجه این است که در این تصویر (زیر) تراشه های ساخت میکرون «Micron» دیده میشود و همین مورد نشان میدهد که سیلیکون های معماری جدید پاسکال «Pascal» از مدت ها پیش در اختیار تولید کنندگان کارت های غیر مرجع قرار گرفته است. لازم به ذکر است؛ اطلاعات منتشر شده در این سند که در اینجا هم قابل مشاهده است نشان میدهد در حال حاضر فقط سه شرکت مشغول تولید حافظه های HBM هستند که شامل کمپانی SK Hynix ،Samsung و Micron میشوند.
در حال حاضر دو کمپانی SK Hynix و Samsung به طور رسمی این چیپ ها را تولید میکنند و تنها یکی از این سه شرکت اطلاعاتی را در این مورد به انتشار عمومی رسانده است. بر اساس این اطلاعات قرار بود در این کارت ها از حافظه های HBM2 استفاده شود که در حال حاضر مشخص شده این حافظه ها از نوع GDDR5X میباشند. با دقت در این تصویر میتوانیم طراحی کاملاً سفارشی شده ای ببینیم که شامل ۲ کانکتور ۸ پین برای مدار فازی و تامین توان مصرفی کارت MSI است.
به هر حال؛ به دقت به تصویر فوق، متوجه نصب ۸ گیگ حافظه در اطراف تراشه گرافیکی میشویم که همانند دیگر تصاویری است که قبلاً از این PCB منتشر شده و همین مورد میتواند صحت وجود کارت گرافیک GeForce GTX 1070 و احتمالاً GTX 1080 را تایید کند. البته این حافظه ها از نوع GDDR5 و با فرکانس هسته ۲۰۰۰ مگاهرتز (۸۰۰۰ مگاهرتز موثر) میباشند. استفاده از حافظه های نسل گذشته GDDR5 در این کارت کمی سوال برانگیز بود که با اطلاعات جدیدی که بدست آمده این شبه نیز بر طرف شده است.
تراشه های گرافیکی رده بالا «High-end»
تراشه Kepler GK104 | تراشه Maxwell GM204 | تراشه Pascal GP104 | |
مساحت ویفر «Die» | ۲۹۴ میلیمتر مربع | ۳۹۸ میلیمتر مربع | احتمالاً ۳۵۰-۴۰۰ میلیمتر مربع |
ترانزیستور | ۳.۵ بیلیون | ۵.۲ بیلیون | احتمالاً ۱۰.۲ بیلیون |
موتور GPC | ۴ | ۴ | ۴ |
SM | ۸ | ۱۶ | ۴۰ |
کودا «CUDA» | ۱۵۳۶ | ۲۰۴۸ | ۲۵۶۰ |
اطلاعات جدید حاکی از آن است که کارت گرافیک GeForce GTX 1070 ازمدل تغییر یافته فناوری حافظه GDDR5 به نام GDDR5X استفاده میکند و این در حالی است که GTX 1070 قرار است با فناوری حافظه GDDR5 عرضه شود. هر دو حافظه نیز از ۲۵۶ یک گذرگاه حافظه ۲۵۶ بیتی استفاده میکنند. همچنین اطلاعات فعلی نشان میدهد تمام کارت های مبتنی بر تراشه GP104-400 از خروجی تصویر DisplayPorts و HDMI و DVI استفاده خواهند کرد.
نگاهی به تراشه کامل پاسکال «Pascal»
معماری جدید پاسکال «Pascal» دو مدل تراشه دارد که یکی از آنها کامل است (یعنی تمام واحد های SM آن فعال است) و مدل دیگری که قرار است در کامپیوترهای خانگی مورد استفاده قرار بگیرد به صورت محدد است. (یعنی نیمی واحد های SM آن فعال است). نسخه کامل این معماری با تراشه قدرتمند GP100 عرضه میشود که در مطلب «با دو تراشه گرافیکی Tesla P100 و Pascal GP100 آشنا شوید» در مورد جزئیاتش صحبت کردیم. این تراشه قرار است به ۶۰ واحد SM یا «Streaming Multiprocessors» عرضه شود که در محصولات مختلف میتواند تظنیمات مختلفی داشته باشد.
مثلاً تراشه قدرتمند Tesla P100 از ۵۶ واحد SM استفاده میکند! SM های موجود در GP100 از ۶۴Single-Precision هسته های کودا «FP32» استفاده میکند. این مقدار در هسته های دو معماری «ماکسول» و «کپلر» معادل ۱۲۸ و ۱۹۲ واحد پردازش اعشار ۳۲ بیتی «FP32» بود. SM های موجود در GP100 به دو بلوک پردازشی تقسیم میشوند که هر بلوک از هسته های کودا متشکل از ۳۲ واحد پردازش اعشاری یا «۳۲ Single-Precision» است. بنابراین یک واحد دستور العمل بافرینگ « Instruction Buffer»؛ یک واحد زمانبندی «Warp Scheduler» و دو واحد ارسالی «Dispatch Units» در این معماری دیده میشود.
[su_note note_color=”#f5f7f7″]بررسی ابتدایی ترشه گرافیکی پاسکال[/su_note]
در بخش محاسبات ۶۴ بیت اعشار «FP64» هر SM موجود در GP100 از محاسبات اعشار ۳۲Double Precision هسته کودا «FP64» استفاده میکند که نصف تعداد هسته های کودا در حالت تک دقتی «FP32 Single Precision» است. این یعنی تراشه کامل GP100 از ۱۹۲۰ هسته کودا FP64 استفاده میکند. این اعداد و توضیحات بدین معناست که GP100 معماری جدید پاسکال «Pascal» در حالت پردازش محاسبات اعشار ۶۴ بیتی که برای دقت بسیار بالا مورداستفاده قرار میگیرد از بهره وری بسیاربالایی استفاده میکند که در نسل گذشته وجود نداشته است.
تراشه GP100 از ۴۰۹۶ کیلوبایت کش «Cache» نوع L2 استفاده میکند که میتواند کارآمدی بسیار بالایی برای این تراشه فراهم کند. این به معنای سرعت به اشتراک گذاری بالاتر اطلاعات پردازشی در هسته های GPU است. برای مقایسه بد نیست بدانید که این مقدار کش در تراشه GK110 فقط ۱۵۳۶ کیلوبایت و در GM200 معادل ۳۰۷۲ کیلوبایت بود. کش بیشتر تراشه به معنای کمتر شدن GPU DRAM است که میتواند موجب کاهش کلی مصرف برق، کاهش تقاضای پهنای باند و درنهایت بهبود عملکرد تراشه گرافیکی شود.
مقایسه پرچم داران نسل بعدی انویدیا و AMD
مشخصات | AMD Polaris | NVIDIA Pascal |
---|---|---|
پرچمدار | سیلیکون Greenland/Vega10 | سیلیکون GP100 |
لیتوگرافی | ۱۴nm FinFET | ۱۶nm FinFET |
ترانزیستور | تا ۱۸ بیلیون | احتمالا ۱۷ بیلیون |
حافظه | تا ۳۲ گیگابایت HBM2 | تا ۳۲ گیگابایت HBM2 |
پهنای باند | ۱ ترابایت بر ثانیه | ۱ ترابایت بر ثانیه |
معماری | Polaris (یا GCN 4.0) | پاسکال «Pascal» |
خانواده تراشه | فیجی (سری Fury) | GM200 (سری ۹۰۰) |