دلیل کم مصرف بودن نسل دوم معماری ماکسول «Maxwell» چه بود!؟

نسل دوم معماری ماسکول «Maxwell»

پس از گذشت قریب به ۲ سال از معرفی نسل دوم معماری ماکسول «Maxwell»؛ راز بزرگ بهینه بودن این معماری مشخص شد! مشخص است که تغییرات بنیادی زیادی در ماکسول ایجاد شده تا این معماری از لحاظ پهنای باند با ۲۹ درصد پهنای باند بهینه شده در حافظه خودش مواجه شود. مهمترین سیلیکون مربوط به نسل دوم معماری ماسکول «Maxwell» را میتوانیم GM204 بدانیم که در کارت هایی همچون GTX 980 و GTX 970 و همچنین نسخه به روز شده آن در گل سر سبد این سری یعنی GTX 980TI مورد استفاده قرار گرفته است.

سیلیکون GM204 همان نسخه ارتقا یافته GM104 معماری کپلر بزرگ است که با تغییراتی جدی به عنوان جدیدترین شاهکار معماری اینتل در سری کارت های گرافیک نسل گذشته GTX 900 مورد استفاده قرار گرفته است. از خود سیلیکون GM204 برای ساخت دو کارت GTX 980 و GTX 970 استفاده شده که طی بررسی مفصلی به نام «تست و بررسی کامل کارت های گرافیکی GTX 970 & GTX 980» تمامی جوانبش را بررسی کردیم. در کنار GM204 نیز بهتر است به سیلیکون قویتر GM206 اشاره کنیم که به عنوان قلب تپنده Titan X استفاده شد و البته تفاوت خیلی زیادی با GTX 980TI ندارد و قیمت بسیار بالایش در مقابل کارایی این کارت، جنبه تجاری بودنش را بیشتر نمایان میکند.

Die این تراشه اندازه ای برابر با ۳۹۸ میلیمتر مربع دارد و ۵.۲ میلیارد ترانزیستور را در خودش جای داده و با لیتوگرافی ۲۸ نانومتری تولید شده است. از طرفی طراحی منحصر به فرد و بسیار بهینه نسل دوم معماری ماکسول «Maxwell» یا ماکسول بزرگ «BIG Maxwell» موجب دو برابر شدن دیگر منابع سخت افزاری مهم همچون ROPs و L2 Cache شده که نتیجه آن کاهش ۱۵ درصدی توان مصرفی GM204 است. این یعنی با توان مصرفی کمتری به نسبت تراشه های نسل قبلی میتوان به راندمان و کارایی بیشتری رسید و این دقیقاً یکی از شاهکارهای نسل دوم معماری ماکسول است.

شروعی بر بهینه سازی معماری های انویدیا

نکته مشترکی که در بین معماری های انویدیا وجود دارد و بسیار هم مهم است، حرکت انویدیا از HWS به SWS و قوی تر شدن دیتا شیت های SW های موجود در معماری ماکسول دو است. «HWS» مخفف «Hardware scheduling» یا همان برنامه ریزی سخت افزاری است که از زمان معماری فِرمی به بعد در تمامی کارت های انویدیا به صورتی جدی دیده میشود. Hardware scheduling یا همان برنامه ریزی سخت افزاری، یعنی سخت افزار در داخل تراشه گرافیکی «GPU» فقط کار زمان بندی «Scheduling» را انجام میدهد.

زمانی که زمان بندی «Scheduling» دستورات درون تراشه گرافیکی «GPU» انجام شود موجب میشود رشته ها «Thread» از سرعت بسیار بیشتری برخوردار شوند که البته این سرعت هم شرایطی دارد. مثلاً اگر مکانیزم تِرَد بندی دستورات چک Ilp مخفف Instruction Level Parralisim (یا موازی گرایی/پاراللیسم) را داشته باشیم، بهتر است که برای جوگیری از تاخیرات مختلف، پردازش اطلاعات از طریق نرم افزار و پردازنده صورت گیرد، اما اگر مکانیزم رده بندی دستورات یا مبنای پردازشی آنها بر اساس تکنیک TLP مخفف «Thread Level Parallelism» باشد، با شرایط بهتری مواجه میشویم.

چون دیگر نیازی به روش دستورات چک Ilp نیست و همین مورد یکی از مهمترین دلایل استفاده بیشتر ابر کامپیوترهای جهان از تراشه های گرافیکی است که در آنها از HWS استفاده شده است. مثلاً در معماری فِرمی «Fermi Architecture» تمام تراشه های گرافیکی (GU) از HWS استفاده میکنند و این مورد در تمامی کارت های مبتنی بر معماری GCN هم دیده میشود که البته مدل های انویدیا پیچیده تر هستند و انسجام حافظه نهان «Catch Coherency» بالاتری نسبت به مدل ها مبتنی بر معماری AMD GCN داشته اند.

Dynamic Parallelism

به  همین دلیل است که بسیاری از ابر کامپیوترهای جهان در حال حاضر از معماری ۷-۸ سال پیش شتاب دهنده های فِرمی استفاده میکنند. اما همین مقدار، برای ابر رایانه هایی که از تراشه های گرافیکی مبتنی بر AMD GCN استفاده میکنند بسیار کمتر است. این در حالی است که کمپانی انویدیا از شتاب دهنده های کِپلر و معماری GT200 تِسلا هم استفاده میکند.

روش HWS ایراداتی هم دارد که شامل اشغال حجم زیادی از سطح مساحت تراشه (یعنی ترانزیستور زیادی برای این بخش ها مصرف میشود)، مصرف برق زیاد به خاطر استفاده از واحدهای پر شارژ گیت یا حتی دائم الشارژ زمانبندی، اتصالات بسیار زیاد بخش های مدیریت داده (کل بخش های زمانبندی و مدیریت) که موجب افزایش مصرف برق تراشه میشوند و همچنین طراحی پیچیده و اتصالات زیاد بین گیت ها میشود که باعث ایجاد نشتی الکترون بیشتر (Leakage) میشود که نتیجه آن افزایش دما است.

اما SWS چیست!؟ این کلمه مخفف «Software Scheduling» یا زمان بندی نرم افزاری است و همانطور که از نامش پیداست، زمان بندی برای پردازش اطلاعات به صورت نرم افزاری انجام میشود. در مورد معماری کارت های انویدیا درون پرانتز بگوییم که هنوز هم بسیاری از کارت های انویدیا از روش HWS استفاده میکنند که دلایل تکنیکی خاص خودش را دارد. مثلاً در معماری های چک دائم یا «ILP»، حدوداً ۹۰ درصد پردازش ها توسط نرم افزار (پردازنده) انجام میشود، چون میزان تاخیر را به  توان عملیاتی «Throughput» ترجیح میدهند.

دلیل کم مصرف بودن نسل دوم معماری ماکسول «Maxwell» چه بود!؟

مثل دو معماری VLIW-4-5 و کمتر از آن هم دو معماری کپلر «Kepler» و نسل دوم معماری ماسکول (Maxwell) که تاخیر بسیار کمی دارند. در واقع نسل دوم معماری ماسکول (Maxwell) یکجور بالانس بین معماری کِپلر «Kepler» و معماری فِرمی «Fermi» است که البته به معماری کِپلر نزدیک تر است. از طرفی شاهکار ماسکول «Maxwell» روی کاغذ از معماری نسل قبلش (کِپلر) ضعیف تر، اما در عمل قویتر و همچنین توان پردازشی بهتری دارند. مزایا و معایب SWS هم دقیقاً معکوس روش HWS است.

مثلاً اگر مدیریت ترد ها تاخیر داشته باشد، بهتر است تعداد هسته ها زیاد باشد تا تاخیر جبران شود، دقیقا شبیه همان روشی که AMD روی معماری VLIW5 های خودش به طور گسترده استفاده کرده است. (مثل تراشه CYPRESS در HD5870). این توضیحات اندک بحث مفلصی برای این پرسش مهم است که انویدیا چه طور به این حد از بهینگی معماری تراشه گرافیکی «GPU» رسیده و چه عواملی موجب شده تا نسل دوم معماری ماسکول (Maxwell) به نسبت معماری کپلر بزرگ تا این حد بهینه باشد!؟

برای بررسی شروع روند بهبنگی های معماری انویدیا بهتر است مقاله مفصل «از کپلر تا ماکسول | بررسی تخصصی مبحث زمان بندی در معماری های انویدیا» را بخوانید تا با دلایل  کم مصرف بودن نسل دوم معماری ماکسول «Maxwell» و بهینه بودنش آشنا شوید.

دلیل کم مصرف بودن نسل دوم معماری ماکسول «Maxwell» چه بود!؟

راز کم مصرف بودن نسل دوم معماری ماکسول «Maxwell»

حقیقتاً نسل دوم معماری ماکسول «Maxwell» را میتوانیم یک معجزه بنامیم! تغییرات بسیار کم در سطح ویفر «Die» سیلیکونی با فناوری ۲۸ نانومتری و توانی بیش از آنچه روی کاغذ نمایان است و همینطور کارایی به ازای هر وات انرژی مصرفی این معماری به نسبت معماری قبلی خودش از آن یک معجزه توصیف نشدنی ساخته که میتوان ساعت های در موردش نوشت. نسل دوم معماری معاکسول «Maxwell» در زمینه بهره وری انرژی به نسبت نسل گذشه (معماری کپلر بزرگ)  افزایش چشمگیری داشته و به لطف تفکیک بخش های مختلف و آرایش جدید SM ها، امکان دستیابی سریع به قدرت پردازشی بسیار بالایی را با صرف کمترین وقت و انرژی فراهم کرده است.

انویدیا در نسل دوم معماری ماکسول «Maxwell» به طرز چشمگیری حجم حافظه کش سطح دوم را افزایش داد و از بهینه سازی های بسیار یدر سطح ترانزیستورهای استفاده کرده تا بتواند پعنای باند بهینه شده بسیار بالایی برای معماری خودش فراهم کند. حالا و با توصیفاتی که در بالا عرض کردیم؛ یک پژوهشگر به نام دیوید کنتر «David Kanter» از راز بزرگ معماری انویدیا (همان دلیل کم مصرف بودن نسل دوم معماری ماکسول «Maxwell» پرده برداشته است.

 اگر به طور ساده بخواهیم اثبات آقای کنتر را شرح دهیم؛ باید بگوییم که وی با نوشتن کدهایی بر پایه پلتفرم DirectX که به طور اختصاصی با هدف بررسی چگونگی ترسیم یک مثلث توسط تراشه گرافیکی نوشته شده، به شواهد قطعی دست یافته که نشان می دهد ترسیم مثلت ایجاد شده با معماری ماکسول «Maxwell» در مقایسه با معماری کِپلر «Kepler» به روش متفاوتی انجام میشود. یافته های این محقق نشان می دهد از معماری ماکسول «Maxwell» و بعد از آن، رندرینگ تصویر به صورتی کاشی مانند انجام می شود و برخلاف روش معمول، کل صحنه یک باره ترسیم نمی شود.

دلیل کم مصرف بودن نسل دوم معماری ماکسول «Maxwell» چه بود!؟

به فرآیند انتقال تصویر پردازش شده توسط تراشه گرافیکی «GPU» به نمایشگر Rasterisation گفته می شود. یعنی تقسیم تصویر به چندین ناحیه مختلف و بافر کردن اطلاعات لازم برای عملیات Rasterisation در خود ویفر «Die» سیلیکون تراشه گرافیکی که نتیجه آن به کاهش پهنای باند حافظه لازم برای رندینگ، بهبود کارایی و بهره وری انرژی بیشتر می انجامد. در تکنیک ترسیم تصویر به صورت کاشی مانند به جای ترسیم یک باره، تصویر به چندین تکه کوچکتر تقسیم می شود و سپس تراشه گرافیکی «GPU» تکه های مختلف را به ترتیب کنار یکدیگر ترسیم می کند تا به تصویر نهایی دست یابد.

این تکنیک در اصل برای تراشه گرافیکی «GPU» موبایل ابداع شده بود که مزیت آن کاهش مصرف انرژی است. این تکنیک در تراشه گرافیکی «GPU» طراحی شده توسط PowerVR و ARM برای موبایل ها استفاده می شود و چیز تازه ای نیست. اما استفاده از آن در تراشه گرافیکی «GPU» مخصوص کامپیوتر غیر معمول است. در دهه ۱۹۹۰ میلادی از تکنیک مذکور برای یک تراشه گرافیکی «GPU» دسکتاپی استفاده شد، اما به دلیل وجود مشکلاتی از جمله ناسازگاری برای استفاده در تراشه های گرافیکی «GPU» مخصوص کامپیوتر های شخصی کنار گذاشته شد و حالا استفاده از آن تنها به تراشه گرافیکی «GPU» موبایل محدود می شود.

در تراشه گرافیکی «GPU» کامپیوتر یا به طور مشخص کامپیوترهای شخصی، تصویر به صورت آنی و یک باره ترسیم می شود. تکنیک ترسیم قطعه ای در اصل برای تراشه های مخصوص موبایل ابداع شده است، بنابراین استفاده از تکنیک ترسیم کاشی مانند (برش تصویر به قطعه های کوچکتر) توسط انویدیا می تواند به معنی بهبود این تکنیک و برطرف کردن نواقص آن برای استفاده در کامپیوتر باشد. بکارگیری این تکنیک توسط انویدیا از یک جنبه دیگر نیز حائز اهمیت است، در گذشته تراشه گرافیکی «GPU» دسکتاپ با هدف دست یابی به کارایی بیشتر، پر مصرف تر و قدرتمندتر می شدند، اما حالا شاهد تغییر این رویه به کم مصرف تر شدن هستیم.

بخش آخر مقاله؛ برگرفته از شهر سخت افزار
راي شما
1 Star2 Stars3 Stars4 Stars5 Stars6 Stars7 Stars8 Stars9 Stars10 Stars
Loading...

نوشته شده در Intel /Nvidia,بررسی سخت افزار,کارت گرافیک

آخرین نقد و بررسی ها
بررسی کارت گرافیک Sapphire Radeon RX 580 Nitro

بررسی کارت گرافیک Sapphire Radeon RX 580 Nitro

تاريخ بررسي: ۲۳ اردیبهشت, ۹۶
بررسی کارت گرافیک GeForce GTX 1080 Ti Founders Edition

بررسی کارت گرافیک GeForce GTX 1080 Ti Founders Edition

۲۷ اسفند, ۹۵

9.3

بررسی کارت گرافیک MSI GTX 1050 Ti Gaming X 4 GB

بررسی کارت گرافیک MSI GTX 1050 Ti Gaming X 4 GB

۱۲ بهمن, ۹۵

9.0

بررسی کارت گرافیک Gigabyte GTX 1050 Ti G1 Gaming 4 GB

بررسی کارت گرافیک Gigabyte GTX 1050 Ti G1 Gaming 4 GB

۱۴ دی, ۹۵

9.0

بررسی کارت گرافیک MSI RX 480 Gaming X 8 GB

بررسی کارت گرافیک MSI RX 480 Gaming X 8 GB

۹ دی, ۹۵

9.4

روزی سگی، شیری را گفت: با من ستیز کن؛ شیر سر باز زد؛ سگ گفت: نزد تمام سگان خواهم گفت شیر از مقابله با من می هراسد. شیر گفت: سرزنش سگان را خوشتر دارم تا شماتت شیران، که گویند چون شیری باشد که با سگی پنجه در پنجه شده

×
بررسی کارت گرافیک GeForce GTX 1080 Ti Founders Edition
شاخه: Intel /Nvidia,بررسی سخت افزار,کارت گرافیک

بررسی کارت گرافیک GeForce GTX 1080 Ti Founders Edition

تــیم گارد3دی

تیم گــارد3دی (Guard3d.com) سعی بر ارائه مطالب متفاوت در زمینه سخت افزار و بازی دارد و امیدوار است در این زمینه بهترین عملکرد را داشته باشد . تیم گـــارد فعالیت خود را به صورت رسمی از تاریخ 2013-10-14 برابر با 1392-07-22 آغاز کرده و تمامی مطالب تولید شده توسط این سایت برای صاحبین آن محفوظ میباشد. کپی مطالب تنها با ذکر نام (Guard3d.com) مجاز است و ما از کپی مطالب بدون ذکر دقیق لینک منبع به صفحه مطلب راضی نیستیم. امیدواریم رضایت شما را جلب کنیم .

شبکه های اجتماعی

کپی رایت 2013 © تمامی حقوق نزد Guard3d محفوظ است | طراحی و کدنویسی توسط hosseincode

error: نمیتوانید کپی کنید!!! فقط لینک صفحه برای آدرس دهی به این مطلب قابل کپی است