مشخص است که تغییرات بنیادی در ماکسول ایجاد شده تا این معماری از لحاظ پهنای باند با ۲۹ درصد پهنای باند بهینه شده در حافظه خود مواجه شود. تا کنون سه تراشه مبتنی بر نسل دوم معماری ماکسول معرفی شده و تراشه های رده بالای این سری با چیپ GM204 به بازار عرضه شده اند که در کارت هایی همچون GTX 980، GTX 970 و نسخه به روز شده آن در گل سر سبد این سری یعنی GTX980TI مورد استفاده قرار گرفته است.

تراشه GM204 نسخه ارتقا یافته GM104 معماری کپلر بزرگ است که با تغییراتی جدی به عنوان جدیدترین شاهکار معماری اینتل وارد چرخه رقابتی بازار شده است. از GM104 در کارت هایی همچون GTX770/760/780/670 و … استفاده شده و در حال حاضر کارایی چندانی در مقابل کارت های سری ۹۰۰ مبتنی بر معماری ماکسول (Maxwell) ندارد از GM204 نیز در دو کارت GTX 980، GTX 970 استفاده شده که طی بررسی مفصلی به نام «تست و بررسی کامل کارت های گرافیکی GTX 970 & GTX 980» تمامی جوانبش را بررسی کردیم.

از طرفی در چند وقت اخیر شاهد معرفی GM206 به عنوان قلب تپنده Titan X بودیم که از نظر کارایی تفاوت آنچنانی با GTX 980TI ندارد و قیمت بسیار بالایش در مقابل کارایی این کارت، جنبه تجاری بودنش را بیشتر نمایان میکند. این کارت از ۱۲ گیگابایت حافظه ویدئویی به عنوان فریم بافر استفاده میکند و قدرتمندترین کارت تک هسته ای جهان محسوب میشود. در مقابل GTX 980TI قرار گرفته که از ۶ گیگابایت حافظه پرسرعت ویدئویی (VRAM) بهره میبرد که رقیب قدرتمندی همچون ADM Fury X را در مقابل میبیند.

معماری-ماکسول-و-کپلر

قرار بود GM206 همچون GM204 با لیتوگرافی ۲۰ نانومتری عرضه شود که به دلیل مشکلات مختلف با فناوری ۲۸ نانومتری به تولید انبوه رسید. Die این تراشه اندازه ای برابر با ۳۹۸ میلیمتر مربع دارد و ۵.۲ میلیارد ترانزیستور را در خود جای داده است. کاهش فناوری ساخت به رقم های پایین تر به معنای کاهش مصرف برق و افزایش ترانزیستور است که نتیجه آن افزایش کارایی و عملکرد تراشه میباشد که متاسفانه اینگونه نشد.

 680780980
TFLOPS345
حافظه2 گیگ3 گیگ4 گیگ
نسبت عملکرد11.52
مصرف برق195 وات 250 وات165 وات
GFOPS/WATT151530

موتور PolyMorph Engine

در نسل دوم معماری ماکسول شاهدیم که واحدهای Streaming Multi Processor به دو برابر افزایش پیدا کرده اند. این بدین معناست که PolyMorph Engine در پردازش گرافیکی دو برابر GM104 قوی تر است و از قدرت پردازش بیشتر برخوردار است. PolyMorph Engine یک موتور پردازش گرافیکی است که از پنج بخش مهم Vertex Fetch، Tessellation، Iewport Transform، Attribute Setup و Stream Output تشکیل شده است.

کار این بخش ها بدین صورت است که پس از پردازش اولیه تصاویر گرافیکی، نتیجه نهایی هر بخش به یک Streaming Multi Processor فرستاده میشود. اما در صورتی که به این بخش نرود در بخش دیگری به نام Shader Program اجرا میشوند و سپس برای پردازش جلوه های گرافیکی به سایر بخش های PolyMorph Engine فرستاده میشوند. پس از پایان پردازش های لازم روی جلوه های ویژه گرافیکی، نتایج به Raster Engine ها فرستاده میشود.

بلوک-دیاگرام-GTX-980

در معماری GM204 هر دیاگرام SMM دارای یک موتور پردازش جلوه های گرافیکی است و تعداد Streaming Multi Processor های موجود در GM204 به نسبت معماری GK104 به دو برابر افزایش یافته که نتیجه آن افزایش سرعت موتور PolyMorph Engine در پردازش سریعتر جلوه های گرافیکی است. نسخه سوم این موتور افزایش دو برابری سرعت پردازش های سنگین هندسی (Geometry) و افزایش سه برابری پردازش قابلیت های فناوری Tessellation را به همراه آورده است.

نگاهی عمیق تر به قلب GM204

طراحی منحصر به فرد و بسیار بهینه نسل دوم معماری ماکسول (Maxwell) یا (BIG Maxwell) موجب دو برابر شدن دیگر منابع سخت افزاری مهم همچون ROPs و L2 Cache شده که نتیجه آن کاهش ۱۵ درصدی توان مصرفی GM204 است. این یعنی به توان مصرفی کمتر به نسبت نسل قبل میتوان به راندمان کارایی بیشتری رسید و این دقیقا یکی از شاهکارهای نسل دوم معماری ماکسول است.

GM204 همانند GM104 دارای ۴ واحد پردازش گرافیکی تحت نام GPC یا همان کلاستر (Graphics Processor Cluster) است که در تصویر بالا به صورت مربع های سبز رنگ قابل مشاهده است. هر دو تراشه از ۴ واحد ۶۴ بیت (در مجموع ۲۵۶ بیت) کنترلر حافظه GDDR5 با قابلیت پشتیبانی از چیپ های حافظه با فرکانس موثر بیش از ۷ گیگاهرتز استفاده میکنند. این مورد برای سازندگان کارت های غیر مرجع و شرکای انویدیا بسیار مهم است تا بتوانند کارت هایی با حافظه موثر بیشتر تولید و به بازار عرضه کنند.

واحد های SMX در معماری نسل قبل کپلر (Kepler)واحدهای SMM در نسل دوم معماری ماکسول (Maxwell)
معماری به روز شده و جدید ماکسول

معماری به روز شده و جدید ماکسول

معماری به کار رفته رد سری کپلر

معماری به کار رفته در سری کپلر

L2 Cache بین تمامی GPC های GM204 و GM206 2 مگابایت است، در حالی که این مقدار روی GK104 فقط ۵۰۱۲ کیلوبایت بود! در معماری جدید، هر واحد GPC از ۱۶ عدد واحد ROP استفاده میکند که در مجموع ۶۴ عدد میشوند. اما در معماری مپلر (GM104) از ۸ عدد ROP به ازای هر GDC استفاده شده بود که در مجموع مقدارش به ۳۲ واحد میرسید. یعنی همه چیز دو برابر شده و نتیجه آن افزایش ۱۲ درصدی سرعت کلاک هسته تراشه گرافیکی (GPU) و افزایش ۱۳۲ درصدی میزان Pixel-Fill Rate در GM206 است.

این مقدار بدین معناست که در GM206 با ۷۲ گیگاپیکسل بر ثانیه (در GM104 این مقدار ۳۲.۲ گیگاپیکسل است) توان عملیاتی بیشتر مواجه ایم که نتیجه آن افزایش کارایی بیشتر تراشه گرافیکی در وضوح های تصویر بالا و پردازش قویتر بر روی تکنیک های AA بالا است. خلاصه بگوییم یعنی بازی های طبیعی تر! هر واحد GDC در معماری ماکسول از ۴ واحد SMM یا Stream Multi Processor (پردازنده چند جریانی) تشکیل شده است، در حالی که این مقدار در GM104 دارای ۲ واحد SMX بود.

یعنی ۱۶ واحد SMM در برابر ۸ واحد SMX نسل قبل که تفاوت اصلی معماری ماکسول (GM204/206) و کپلر (GM104) است. این تغییر موجب بازنگری کامل در طراحی Stream Multi Processor ها و تغییرات کلی در GDC های نسل دوم ماکسول است که تقاوت اصلی در قدرت پردازش گرافیکی را ایجاد میکند. معماری نسل دوم ماکسول به طور بنیادی تغییر کرده و شامل ۱۲۸ عدد هسته کودا (CUDA) برای هر SMM شده است.

تراشه گرافیکی (GPU)ROP:MC Ratioمجموع ROPs ها
Maxwell تراشه (GM204)16:164
Maxwell تراشه (GM107)8:116
Kepler تراشه (GK110)8:148
Fermi تراشه (GF110)8:148
GT2004:132

این مقدار در SMX های معماری نسل گذشته کپلر به ۱۹۲ عدد محدود شده بود. ۱۲۸ هسته کودا در ۴ بخش ۳۲ تایی تقسیم شده اند و هر بخش به طور جداگانه دارای مابعی همچون واح زمانبندی (Warp Schedulers) و بافر دستور العمل مجز است. این روش بهترین حالت ممکن برای افزایش بازدهی و کاهش توان مصرفی برای پردازش گرافیکی است که در اکثر تست ها شاهد این افزایش کارایی بودیم.

بلوک های L1 Cach مخصوص حافظه اشتراکی (Share Memory) در نسل دوم ماکسول از یک حافظه اشتراکی (Shared Memory) اختصاصی در کنار Texture Cache استفاده میکند که در SMX های کپلر اینگونه نبود. نتیجه این ترکیب سازی افزایش ۴۰ درصدی عملکرد هر کدام از هسته های کودا (CUDA Core) است که موجب بهبود دو برابری راندمان کاری و افزایش ۳۲ درصدی عملکرد هر SM میشود.

با اینکه تعداد هسته های کودا معماری ماکسول در هر SMM به مقدار ۳۲ درصد در مقابل SMX های کپلر کاهش داشته، ولی از کارایی مشابه و مصرف انرژی کمتری برخور دار است. این یعنی شاهکار انویدیا در نسل دوم معماری ماکسول. بهینه سازی این معماری آنقدر دقیق وحساب شده بوده که موج افزایش دو برابری تعداد SMM های معماری ماکسول به نسبت SMX های کپلر شده است.

بهینه-سازی-حافظه

در واقع GM104 از ۴ واحد موتور GPC استفاده میکند و هر واحد این موتور شامل ۴ واحد SMM مجزا و هر واحد SMM از ۱۲۸ عدد هسته کودا استفاده میکند. این یعنی ۲۰۴۸ هسته کودا در تراشه GM206 در برابر ۱۵۳۶ عدد هسته کودا در تراشه GM104 که منجر به افزایش کارایی بسیار زیاد این معماری شده است.

نسل سوم Delta Color Memory Compression

در مورد این تکنیک قبلا صحبت کرده ایم. تاثیر فشار رنگ دلتا (delta color) بستگی زیادی به جزئیات پیسکل هایی دارد که برای محاسبه دلتا رنگ ها انتخاب شدند. نسل دوم معماری ماکسول (Maxwell) از نسل سوم سیستم فشرده سازی دلتا رنگ ها استفاده میکند که موجب بهبود کارایی و عملکرد بیشتر با گزینه های بیشتری برای محاسبه دلتا کمپرسور ها است.

تکنیک فشرده سازی رنگ های موجود در نسل دوم معماری ماکسول (Maxwell) موجب افزایش واقعی پهنای باند موثر بین چیپ های حافظه و تراشه گرافیکی (GPU) شده است. این تکنیک از نوعی الگوریتم فشرده سازی جدید به نام بدون تلفات (Lossless) برای افزایش کارایی پهنای باند استفاده کرده و بدون اینکه کوچکترین افت کیفیتی در بافت ها ایجاد شود، باعث افزایش ۲۹ درصدی پهنای باندموثر حافظه گرافیکی شده است.

فشرده-سازی-دلتا

چیزی که نتیجه آن در سری ۹۰ انویدیا پشیبانی بی دردسر از وضوح تصویر ۴K است. یعنی Maxwell به نسبت Kepler از ۲۵% بایت کمتر در هر فریم استفاده میکند. این بدین معنی است که از منظر هسته (GPU) شاهد افزایش پهنای باند موثر حافظه به رقم ۹.۳ گیگ در ثانیه برای نسل دوم معماری Maxwell هستیم. در آخر نیز اضافه کنم مقاله ویژه دیگری درباره ویژگی ها و فناوری های فنی سری ۹۰۰ انویدیا آماده کردیم که به زودی منتشر میکنم.

منبع anandtech
راي شما
1 Star2 Stars3 Stars4 Stars5 Stars6 Stars7 Stars8 Stars9 Stars10 Stars
Loading...
  1. کوروش says:

    یکی از بهترین مقالاتی خوندم همین بود، به نظرم بازم جا داره در مورد این شاهکار نوشته بشه

حسین

زندگی نامه

نوشته شده در Intel /Nvidia,بررسی سخت افزار,کارت گرافیک

آخرین نقد و بررسی ها
بررسی کارت گرافیک Gigabyte GTX 1050 Ti G1 Gaming 4 GB

بررسی کارت گرافیک Gigabyte GTX 1050 Ti G1 Gaming 4 GB

تاريخ بررسي: ۱۴ دی, ۹۵
بررسی کارت گرافیک MSI RX 480 Gaming X 8 GB

بررسی کارت گرافیک MSI RX 480 Gaming X 8 GB

۹ دی, ۹۵

9.4

بررسی کارت گرافیک ASUS ROG STRIX GTX 1060 OC 6GB

بررسی کارت گرافیک ASUS ROG STRIX GTX 1060 OC 6GB

۱۶ آذر, ۹۵

9.0

بررسی مانیتور AOC Agon AG271QG

بررسی مانیتور AOC Agon AG271QG

۵ آذر, ۹۵

9.4

بررسی کارت گرافیک Palit GTX 1080 GameRock Premium

بررسی کارت گرافیک Palit GTX 1080 GameRock Premium

۱۹ آبان, ۹۵

9.8

روزی سگی، شیری را گفت: با من ستیز کن؛ شیر سر باز زد؛ سگ گفت: نزد تمام سگان خواهم گفت شیر از مقابله با من می هراسد. شیر گفت: سرزنش سگان را خوشتر دارم تا شماتت شیران، که گویند چون شیری باشد که با سگی پنجه در پنجه شده

×
GTX-960
شاخه: Intel /Nvidia,اخبار سخت افزار

عرضه رسمی GeForce GTX 960 توسط انویدیا

تــیم گارد3دی

تیم گــارد3دی (Guard3d.com) سعی بر ارائه مطالب متفاوت در زمینه سخت افزار و بازی دارد و امیدوار است در این زمینه بهترین عملکرد را داشته باشد . تیم گـــارد فعالیت خود را به صورت رسمی از تاریخ 2013-10-14 برابر با 1392-07-22 آغاز کرده و تمامی مطالب تولید شده توسط این سایت برای صاحبین آن محفوظ میباشد. کپی مطالب تنها با ذکر نام (Guard3d.com) مجاز است و ما از کپی مطالب بدون ذکر دقیق لینک منبع به صفحه مطلب راضی نیستیم. امیدواریم رضایت شما را جلب کنیم .

شبکه های اجتماعی

کپی رایت 2013 © تمامی حقوق نزد Guard3d محفوظ است | طراحی و کدنویسی توسط hosseincode

error: نمیتوانید کپی کنید!!! فقط لینک صفحه برای آدرس دهی به این مطلب قابل کپی است