بررسی کارت گرافیک GeForce GTX 1080

بررسی اولیه کارت های گرافیک انویدیا GTX 1070 و انویدیا GTX 1080

مقدمه ای بر هیولای ۸ گیگابایتی انویدیا

در طول سه نسل گذشته؛ حتی طی چهار سال اخیر انویدیا بودجه هنگفتی را به بخش تحقیقاتی خودش اختصاص داده تا بتواند تراشه های گرافیکی قدرتمندی را همراه با بهره وری بیشتر تولید کند. در سال ۲۰۱۲ معماری کپلر «Kepler» و به دنبالش در سال ۲۰۱۴ نسل دوم معماری ماکسول «Maxwell» را با هدف افزایش عملکرد بهتر معرفی کرد که هر دوی آنها جهش بزرگی در فاکتور بهره وری انرژی به همراه داشتند. اخیراً نیز، همانطور که در جریان هستید، از کارت گرافیک قدرتمند GeForce 1080 مبتنی بر معماری پاسکال «Pascal» رونمایی کرده که در دو مقاله «بررسی اولیه کارت های گرافیک انویدیا GTX 1070 و GTX 1080» و «GTX1080 یا GTX1070؛ کدام یک برای بازی به صرفه است؟!» درموردش توضیحات مفصلی دادیم.

انویدیا مدعی است با کارت های فعلی رکورد قبلی مصرف انرژی مربوط به کارت هایش را شکسته و موفق شده به بالاترین میزان بهره وری انرژی برسد و قول داده جهش دیگری در افزایش بهره وری انرژی را شاهد باشیم که البته این ادعا کمی غیر واقعی است و در ادامه مطلب دلایش را توضیح میدهیم. معماری پاسکال «Pascal» برای اولین بار در مراسم GTC انویدیا معرفی شد و در آن مراسم از پردازده قدرتمند Tesla P100 HPC مبتنی بر سیلیکون قدرتمند GP100 رونمایی شد.

همانطور که در مقاله «بررسی کوتاه تراشه گرافیکی پاسکال GP104» عرض کردیم؛ هر دو کارت جدید GeForce GTX 1080 و GeForce GTX 1070 اولین کارت هایی محسوب میشوند که از تراشه قدرتمند GP104 به عنوان قلب تپنده خودشان استفاده میکنند و به عنوان پرچمداران سری کارت های «پاسکال» به همگان معرفی شدند. کارت هایی قرار است در تاریخ «۷ خرداد ۱۳۹۵» و «۲۱ خرداد ۱۳۹۵» به صورت رسمی در اختیار مصرف کننده نهایی قرا بگیرد.

[su_note note_color=”#f5f7f7″]با اولین نسل از تراشه های گرافیکی پاسکال آشنا شوید[/su_note]

GeForce GTX 1080 به صورت منطقی و روی کاغذ موفق تر از بهتر از GeForce GTX 980 است که شرح این موضوع را در ادامه خواهم گفت. از نظر قیمتی هم تفاوت آنچنانی با اسلاف خودش ندارد و با قیمت ۵۹۹ دلاری خودش تفاوت زیادی با ۵۴۹ دلار GeForce GTX 980 ندارد. با این حال انویدیا میتواند با این قیمت موقعیت خودش را به خوبی در بازار تثبیت کند و از آنجایی که GTX 1080 به عنوان یک کارت تک هسته ای از کارت های دو هسته ای قویتر است، میتواند در این مهم بهتر ظاهر شود.

GeForce GTX 1080 در دو مدل مرجع فوندر ادیشن «Founders Edition» و مدل قابل سفارشی معمولی عرضه میشود که تفاوت ۱۰۰ دلاری دارند. یعنی مدل مرجع ۵۹۹ دلاری Founders Edition که میتواند محصول مستقیم تولید شده توسط خود انویدیا باشد و یا بدون هیچگونه تغییری، تنها با بسته بندی دیگر برندهایی همچون ایسوس، گیگابایت، MSI و … عرضه شود. در گذشته مدل های مرجع انویدیا فروش مناسبی نداشتند و پس از معرفی مدل مرجع، با عرضه مدل های سفارشی دیگر برندهایی همچون ایسوس، گیگابایت، MSI و …، شاهد از رده خارج شدن مدل مرجع بودیم.

اما با این ترفند هم مدل های مرجع فوندر ادیشن «Founders Edition» و تولید خود انویدیا بفروش میرسد و هم مدل های سفارشی شده دیگر برندهایی همچون ایسوس، گیگابایت، MSI و … بفروش میرسد. در واقع دو مدل GeForce GTX 1080 داریم که اولی ۵۹۹ دلار و دومی ۴۹۹ دلار با قابلیت سفارشی سازی توسط دیگر بندها است.بنابراین زمانی که سفارشی سازی روی آن انجام شود، قیمتش ممکن است بیش از ۱۰۰ دلار افزایش یابد. بدین معنا که کاربر ترجیح میدهد بین مدل سفارشی شده ای که مثلاً ۴۹۹ دلار بوده و حالا با ۱۵۰ دلار اضافه ۶۵۰ دلار بفروش میرسد، مدل مرجع انویدیا Founders Edition را بخرد!

[su_note note_color=”#f5f7f7″]مقایسه اجمالی کارت گرافیک GTX 980 Ti برندهای مختلف[/su_note]

این یعنی یک بازی برد برد برای انویدیا! بگذریم؛ پردازنده های جریانی «Streaming Multiprocessor» یا SM های معماری پاسکال «Pascal» جز جدا ناپذیری از تراشه گرافیکی «GPU» محسوب میشوند و از مولفه های اختصاصی برای افزایش عملکرد بهتر استفاده میکنند. انویدیا مدعی است برای افزایش بهره وری با دقت بسیار بالایی معماری پاسکال «Pascal» را تولید کرده و برای اولین بار موفق شده از لیتوگرافی ۱۶ نانومتری FinFET در تراشه هایش استفاده کند.

فناوری FinFET یک ترانزیستور با معماری سه بعدی است که می‌تواند با مصرف انرژی کمتر، کارایی بالاتری داشته باشد. از این ترانزیستور در ساخت تراشه‌های موجود در تلفن‌های همراه و کامپیوترها استفاده می‌شود. طراحی و ساخت این ترانزیستورهای سه بعدی از همتایان مسطح (دو بعدی) خود پیچیده‌تر است. معماری FinFET به دلیل هدایت گرمایی کمتر، گرمای بالاتری تولید می‌کند که این روش افزایش دما و احتمال بروز پدیده «الکترومایگریشن» را در سیم‌های نازک افزایش داده و عمر قطعات الکترونیکی را کاهش می‌دهد.

منتهی ترانزیستورهایی با این روش از ساختار عملکرد بسیار بالایی برخوردارند و به همین دلیل است که در هر دو کارت گرافیک نسل جدید انویدیا پاسکال GTX 1080 و GTX 1070 از این فناوری برای تولید کارت های جدید استفاده شده است. GTX 1080 از ۲۵۶۰ عدد هسته کودا استفاده میکند که در مقایسه میتوان به GTX 980 اشاره کرد که فقط از ۲۰۴۸ عدد هسته کودا استفاده میکند. واحدهای TMU مقدار ۱۶۰ در مقابل ۱۲۸ عدد و دو برابر شدن حافظه در GTX 1080 به نسبت GTX 980 از ویژگی های بارز و مشهود کارت های جدید است.

تصویر شماتیک از فناوری های جدید کارت های گرافیک سری ۱۰۰۰ انویدیا

فناوری حافظه هم با کمی ارتقا به GDDR5X تبدیل شده و به نسبت HBM حافظه ارزان تری است و از نظر پهنای باند می‌تواند ۱٫۵ تا ۲ برابر بهتر از GDDR5 باشد. این حافظه های تکامل یافته از ۲ برابر تراکم حافظه بیشتر همراه با مصرف انرژی کمتری استفاده میکنند و به همین دلیل استفاده از این مدل حافظه ها در کنار تراشه‌ی GM204 امری منطقی و معقول است که مهندسین انویدیا به خوبی از عهده آن بر آمده اند. استفاده از حافظه GDDR5X میتواند موجب افزایش پهنای باند بیشتر و پشتیبانی بهتر از فرکانس هسته بالاتر شود که همین مورد تفاوت اصلی دو کارت گرافیک GTX 1080 و GTX 1070 را شکل میدهند.

کلاک حافظه به صورت متناوبی روی ۱۰ گیگاهرتز موثر تنظیم شده که به لطف گذرگاه حافظه ۲۵۶ بیتی میتواند ۳۲۰ گیگابایت پهنای باند حافظه را در اختیار تراشه گرافیکی قرار دهد. چنین پهنای باندی فقط با یک گذرگاه ۳۸۴ بیتی یا ۵۱۲ بیتی در حافظه های GDDR5 امکان پذیر بود که حالا به لطف حافظه های GDDR5X با گذرگاهی کمتر میتوان به پهنای باند بیشتری رسید. اولین نسل از حافظه های HBM محدود به ۴ گیگابایت حافظه ویدئویی بود، دومین نسل از این حافظه یا HBM2 نیز به دلیل گران بودن حاضر نشد و به همین دلیل انویدیا از حافظه های توسعه یافته GDDR5X برای GeForce GTX 1080 استفاده کرده است.

GeForce GTX 1080 با فرکانس کلاک ۱۶۰۷ مگاهرتزی معرفی شده که این مقدار میتواند در حالت بوست یا همان فرکانس کمکی به ۱۷۳۳ مگاهرتز افزایش یابد. در رویدادی که همین چند وقت برگذار شده بود، انویدیا نشان داد که فرکانس این کارت به راحتی تا ۲.۱ گیگاهرتز قابل اورکلاک است و این فرکانس فقط با طراحی بُرد مرجع و بدون مشکل حرارتی انجام شده بود. این مورد نشان میدهد نسخه های غیر مرجع میتوانند با خنک کننده قدرتمندتر از کلاک بیشتر هم پشتیبانی کنند و این یعنی سوت ورود به دوران ۲ گیگارتزی!

نسل چهارم سیستم فشرده سازی رنگ های دلتا «Delta Color Compression»

حافظه های GDDR5X ای که روی GeForce GTX 1080 استفاده شده اجازه میدهد رابط کاربری این حافظه بتواند از نرخ موثر داده ۱۴ گیگاهرتزی استفاده کند که این مقدار بسیار فراتر از قدرت تحمل حافظه های GDDR5 قبلی است. این مدل حافظه توانایی کار در فرکانس پایه ۱۰ گیگاهرتزی را دارد و فقط با استفاده از گذرگاه ۲۵۶ بیتی میتواند پهنای باندی معادل ۳۲۰ گیگابایت بر ثانیه را در کنار نسل چهارم سیستم فشرده سازی رنگ های دلتا «Delta Color Compression» ایجاد کند.

این سناریو میتواند بهترین حالت فشرده سازی رنگ های دلتا را ایجاد کند که نتیجه آن افزایش ۲۰% پهنای موثر حافظه تا ۳۸۴ گیگابایت است.

مقایسه مشخصات سه کارت گرافیک GTX 1080 و GTX 980 Ti و GTX 980

GeForce GTX 1080GeForce GTX 980 TiGeForce GTX 980
لیتوگرافی ساخت۱۶ نانومتری FinFET۲۸ نانومتر۲۸ نانومتر
سیلیکون GP104-400GM200-310GM204-400
هسته کودا۲۵۶۰۲۸۱۶۲۰۴۸
واحدهای TMUمشخص نیست۱۷۶۱۲۸
واحدهای ROPمشخص نیست۹۶۶۴
نوع حافظه۸GB GDDR5X۶GB GDDR5۴GB GDDR5
کلاک پایه۱۶۰۷ مگاهرتز۱۰۰۰ مگاهرتز۱۱۲۷ مگاهرتز
کلاک بوست۱۷۳۳ مگاهرتز۱۰۷۶ مگاهرتز۱۲۱۶ مگاهرتز
کلاک حافظه۲۵۰۰ مگاهرتز۱۷۵۰ مگاهرتز۱۷۵۰ مگاهرتز
کلاک موثر حافظه۱۰۰۰۰ مگاهرتز۷۰۰۰ مگاهرتز۷۰۰۰ مگاهرتز
گذرگاه حافظه۲۵۶ بیت۳۸۴ بیت۲۵۶ بیت
پهنای باند حافظه۳۲۰ گیگابایت بر ثانیه۳۷۷ گیگابایت بر ثانیه۲۲۴ گیگابایت بر ثانیه
توان مصرفی (TDP)۱۸۰ وات۲۵۰ وات۱۶۵ وات
کانکتور برق۱ عدد ۸ پین۸ و ۶ پین۲ عدد ۶ پین
قیمت۵۹۹ دلار۶۴۹ دلار۵۴۹ دلار

صفحه بندی

صفح اول: مقدمه ای بر هیولای ۸ گیگابایتی انویدیا

صفحه دوم: بررسی فنی معماری به کار رفته در GeForce GTX 1080

صفحه سوم: فناوری های جدید استفاده شده در معماری GeForce GTX 10xx

صفحه چهارم: بررسی کارت گرافیک GeForce GTX 1080 8GB

صفحه پنجم: بنچمارک عملکرد در بازی، مصرف برق، حرارت و نویز

صفحه ششم: تحلیل نهایی و راهنمای خرید کارت گرافیک GTX 1080

بررسی فنی معماری به کار رفته در GeForce GTX 1080

GeForce GTX 1080 به عنوان اولین کارت گرافیک سری ۱۰۰۰ انویدیا از ۴ خوشه پردازشی «GPC» تشکیل شده که هر GPC از ۵ واحد SM با ظرفیت ۱۲۸ هسته پردازشی کودا «CUDA» استفاده میکند که این مقدار در مجموع برابر ۲۵۶۰ هسته کودا است. این کارت گرافیک غول پیکر از دومین تراشه بزرگ معماری پاسکال «Pascal» به نام GP104 استفاده میکند که پیش از این در مقاله مفصل «با دو تراشه گرافیکی Tesla P100 و Pascal GP100 آشنا شوید» در موردش صحبت کردیم.

سیلیکون GP104 نوعی مدل ارتقا یافته و البته محدود از سیلیکون GM204 است که در دو کارت نسل قبل «GTX 980 و GTX 970» مورد استفاده قرار گرفته و از مساحت ویفری «Die» معادل ۳۱۴ میلیمتر مربع استفاده میکند. این مقدار در سیلیکون GM204 معادل ۳۹۸ میلیمتر مربع است و بدین معناست که GP104 با وجود کوچک تر شدن سطح ویفر سبز رنگش، از بهره وری انرژی بهتری استفاده میکند. روی این سیلیکون ۷.۲ بیلیون ترانزیستور نصب شده و برای مقایسه بد نیست بدانید که همین مقدار روی سیلیکون GM204 فقط معادل ۵.۲ بیلیون ترانزیستور است!

اما؛ قویترین و بزرگترین تراشه معماری پاسکال «Pascal» سیلیکون GP100 است که برای پردازش ابر کامپیوتر Tesla P100 HPC مورد استفاده قرار گرفته است. بنابراین، معماری پاسکال «Pascal» دارای دو مدل سیلیکون است که یکی از آنها کامل است (یعنی تمام واحد های SM آن فعال است) و دیگری که قرار است در کامپیوترهای خانگی مورد استفاده قرار بگیرد محدود است (یعنی نیمی از واحد های SM آن فعال است).

بلوک دیاگرام نهایی معماری کارت گرافیک GeForce GTX 1080

لازم به ذکر است سیلیکون GF100 انویدیا نیز از ۵۱۲ پردازنده جریانی «Stream Processors» استفاده میکند که کمپانی انویدیا آنها را هسته های کودا «CUDA Cores» مینامد. این هسته ها در ۳۲ بلوک مجزا از هم قرار گرفتند که پردازنده چند جریانی «Streaming Multiprocessor» گفته میشوند. بنابراین سیلیکون GP100 معماری پاسکال «Pascal» از چهار بلوک Streaming Multiprocessor یا «SM» مخصوص به خودش استفاده میکند که هر کدام یک از این بلوک ها دارای خوشه های پردازشی «Graphics Processing Cluster» مساوی یا همان کلاسترهای سبز رنگ مخصوص به خودشان میباشند.

به طور خلاصه؛ هر سیلیکون از یک دیاگرام کلی (مثل تصویر زیر) تشکیل شده که شامل پردازنده جریانی «Stream Processors» است و هر پردازنده جریانی در واحد یا بلوک هایی به نام Streaming Multiprocessor یا «SM» قرار گرفتند و هر SM نیز درون واحد بزرگتری جای گرفته که به طور خلاصه GPC یا خوشه های پردازشی «Graphics Processing Cluster»و  یا به عبارتی ساده تر همان کلاسترهای سبز رنگ نامیده میشوند که بارها در معماری های مختلف مشاهده کرده اید.

از معماری فرمی «Fermi» به بعد، انویدیا پردازنده های جریانی «Streaming Multiprocessor» یا SM های خودش را با افزودن منابع اختصاصی اضافی بیشتر کرده و از طرف دیگر هم منابع پردازشی درون خوشه های پردازشی «کلاستر یا موتور GPC» خودش را کاهش داده که نتیجه آن افزایش بی نظیر بهره وری کارت گرافیک GeForce GTX 1080 در مقابل کارت های کارت های نسل قبل مبتنی بر «نسل دوم معماری ماکسول «Maxwell» است. اما همین روند نیز دقیقاً با سیلکیون های مبتنی بر معماری پاسکال «Pascal» دنبال شده است.

واحدهای اجراییPolyMorph Engine و Raster Engine و توزیع کردن کارها میان خوشه‌های پردازشگر گرافیک (GPC)

سیلیکون GM204 همچون سیلیکون نسل قبلی GP104 از ۴ موتور GPC استفاده میکند و زیر رابط های فوق تخصصی به کار رفته در تراشه گرافیکی «GPU» این کارت با اسلات PCI-Express 3.0 x16 به اشتراک گذاشته شده که میتواند پهنای باند وسیعی را برای این کار فراهم کند. انتظار میرود کارت گرافیک GeForce GTX 1070 از ۷ گیگابیت حافظه GDDR5 در عوض ۱۰ گیگابیت حافظه GDDR5X به کار رفته در GeForce GTX 1080 استفاده کند. این مورد با وجود استفاده از کنترلرهایی که از هر دو حافظه GDDR5X و GDDR5 پشتیبانی میکنند بعید به نظر نمیرسد.

همچنین گذرگاه حافظه ۲۵۶ بیتی و فناوری GDDR5X این کارت نیز از هشت واحد کنترلر حافظه استفاده میکند. به هر حال؛ عملیات توزیع کردن کارها میان خوشه‌های پردازشگر گرافیک (GPC) توسط موتور GigaThread Engine انجام میشود که از ۲ مگابایت حافظه کش پر سرعت مشترک بین تمام GPC ها استفاده میکند. GigaThread Engine نوعی عملگر ثابت سخت افزاری است که انویدیا آنها را زمانبندی «Scheduler» نامیده و سیستم بسیار مهمی است که در قبلاً در مقاله «از کپلر تا ماکسول | بررسی تخصصی مبحث زمان بندی در معماری های انویدیا» به طور مفصل در موردش صحبت کردیم.

در مورد عملگرها باید اشاره کنیم که دو مورد از مهمترین آنها واحدهای اجرایی به نام PolyMorph Engine و Raster Engine هستند. PolyMorph Engine در واقع یک موتور پردازش گرافیکی است که از پنج بخش مهم Vertex Fetch، Tessellation، Iewport Transform، Attribute Setup و Stream Output تشکیل شده است. کار این بخش ها بدین صورت است که پس از پردازش اولیه تصاویر گرافیکی، نتیجه نهایی هر بخش به یک Streaming Multi Processor فرستاده میشود.

طراحی عالی معماری کارت گرافیک GTX 1080 برای افزایش سرعت

اما در صورتی که به این بخش نرود در بخش دیگری به نام Shader Program اجرا میشوند و سپس برای پردازش جلوه های گرافیکی به سایر بخش های PolyMorph Engine فرستاده میشوند. پس از پایان پردازش های لازم روی جلوه های ویژه گرافیکی، نتایج به Raster Engine ها فرستاده میشود. برای مقایسه بد نیست بدانید که در معماری GM204 هر دیاگرام SMM دارای یک موتور پردازش جلوه های گرافیکی بود و تعداد پردازند های جرانی «Streaming Multi Processor» های موجود در GM204 به نسبت سیلیکون های معماری GK104 به دو برابر افزایش یافته که نتیجه آن افزایش سرعت موتور PolyMorph Engine در پردازش سریعتر جلوه های گرافیکی است.

اما؛ نسخه سوم این موتور افزایش دو برابری سرعت پردازش های سنگین هندسی «Geometry» و افزایش سه برابری پردازش قابلیت های فناوری Tessellation را به همراه آورده است. اما PolyMorph Engine در سیلیکون GP100 وظیفه ی رسیدگی به کارهای هندسی «Geometry» را بر عهده دارد. در واقع همانطور که در بالا هم عرض کردیم، رسیدگی به تسلیشن «Tessellation»، موزاییک کاری «Vertex Fetch»، تکنیک Attribute Setup، تکنیک Viewport Transform و Stream Output ها بر عهده موتور PolyMorph Engine است.

در معماری پاسکال «Pascal» هر SM از یک PolyMorph Engine استفاده میکند. بدین معنا که در مجموع هر سیلیکون GP100 از ۱۶ واحد PolyMorph Engine استفاده میکند. تمامی این امور قبلاً توسط خط لوله ها «Pipeline» انجام میشد و حالا به دلایل نا مشخصی انویدیا تصمیم گرفته واحد جداگانه ای برای آنها در نظر بگیرد و در هر چیپ از ۱۶ واحد آنها به صورت یکجا استفاده کند. اما Raster Engine برای کارهایی همچون تنظیم لبه ها «Edge Setup»، بازتاب تصاویر «Rasterization» و Z-Culling مورد استفاده قرار میگیرد.

[su_note note_color=”#f5f7f7″]از کپلر تا ماکسول | بررسی تخصصی مبحث زمان بندی در معماری های انویدیا[/su_note]

مقایسه پهنای باند کارت گرافیک GTX 1080 و کارت گرافیک GTX 980

تمامی این کارها پیش از این توسط خط لوله ها «Pipeline» انجام میشد و حالا واحدی مجزا برای این پردازش ها در نظر گرفته شده است. بنابراین هر GPC یا خوشه پردازشی در معماری پاسکال «Pascal» از ۱ واحد Raster Engine استفاده میکند که در مجموع ۴ واحد Raster Engine در هر ویفر «Die» میشود. این واحد ز زمان GT200 تغییرات کمی داشته که بیشتر به تغییرات محل قرار گیری آن بر میگردد. Raster Engine های معماری پاسکال «Pascal» در هر کلاک می توانید ۸ پیکسل را پردازش کنند که در مجموع میتوان گفت که هر سیلیکون GF100 میتواند ۳۲ پیکسل را در یک کلاک پردازش کند که قدرت پردازشی بسیار بالایی است.

Raster Engine قابلیت بسیار مهمی است و اولین شرکت بازیسازی که به سمت پردازش Classic Raster Grahgics «تصویر سازی گرافیک به صورت کلاسیک یا گرافیک شطرنجی» حر کت کرده، استدیو id Software است که از این ویژگی در بازی Doom 2016 استفاده کرده است. در واقع این قابلیت مهم در بازی برای ایجاد ساختار گرافیکی هر عکس به صورت فرمت «BitMap» است که هر نقطه در این روش، نماینده یک شبکه گسترده از پیکسل ها است.

از منظر مقایسه مشود که گفت که در معماری پاسکال «Pascal» با دو سیلیکون GP100 و GF100 به نسبت GT200 تا ۸ برابر افزایش عملکرد در کارایی هندسی را شاهدیم و تنها دلیل افزایش بی حد و مرز توان پردازش هندسی در سری ۱۰۰ انویدیا را میتوان استفاده مناسب از تسلیشن «Tessellation» و تکنیک هی قدرتمند Displacement Mapping ها برای خلق کاراکترها و اشیای پیچیده دانست. بنابراین با این زاویه نگاه میتوان وجود ۱۶ واحد PolyMorph Engine و ۴ واحد Raster Engine در یک سیلیکون را توجیه کرد. این استراتژی میتواند موجب عملکرد بهتر کارت های این سری شود و انویدیا هم مدعی شده بالاترین بهره وری ممکن را خواهیم دید.

[su_note note_color=”#f5f7f7″]آنالیز اولیه تراشه های گرافیکی نسل بعد انویدیا پاسکال[/su_note]

تکنیک جدید «Preemption» یا «Dynamic Load Balancing»

البته شاید تکیه بر افزایش بیش از حد این واحدها بی ارتباط با موتور محاسباتی غیرهمگام یا «Asynchronous Compute Engines» نباشد! موتوری که انویدیا اعلام کرده به طور کامل از آن پشتیبانی میکند و این مهم از طریق تکنیک جدیدی به نام «Preemption» یا «Dynamic Load Balancing» در سطح کاملا ارتقاء یافته انجام میشود. هدف Preemption دقیقاً مشابه Async Compute جهت استفاده از سایر منابع پردازشی تراشه گرافیگی (GPU) جهت توسعه عملکردی کلی می باشد. این واحد ها به این منظور به خدمت گرفته شدند که به دستورات پردازنده (Command Processor) برای عملیات های مربوط به محاسبات (Compute) کمک کنند.

هدف اصلی ACEs ها قبول کارها برای ارسال به CU برای پردازش است. (نقشی شبیه GTE یا Giga Thread Engine های انویدیا که شاید عملکرد صحیح و برنامه ریزی صحیح این واحد، میتوانست کارایی نهایی و قدرت فرمی را در محاسبات GPGPU افزایش میداد که اینگونه نشد). در واقع انویدیا در معماری جدید پاسکال تاکید زیادی در بخش تراکم هسته های Cuda با محوریت عملکرد Double-Precision داشته است و همچنین تعداد و عملکرد بخش Warp Scheduler را کاملا ارتقاء بخشیده است تا در بخش پردازش های ناهمگام کوچکترین مشکلی نداشته باشد.

تعداد و عملکرد Warp Scheduler ها برای پشتیبانی بسیار قدرتمند از Async Compute افزایش داشته و فعلاً هیچ نگرانی بابت پردازش Async Compute روی کاغذ نخواهیم داشت. نکته قابل ذکر این است که استفاده از Async Compute در بازی های مختلف حدود مشخصی دارد و اگر بیشتر از حد تعیین شده باشد تاثیر منفی خواهد گذاشت. البته قدرت خام پردازشی GP100 آنقدر بالاست که حتی اگر پشتیبانی مناسبی از Async Compute به عمل نیاید، به دلیل اسب بخار بالا میتوانیم شاهد عملکرد بسیار مناسبی باشیم. پس جای نگرانی در این زمینه نیست.

پیشنهاد میکنیم در مورد موتور محاسباتی غیرهمگام یا «Asynchronous Compute Engines» سه مطلب مفصل «تحلیل | دعوای انویدیا و AMD در Ashes of the Singularity با DX12» و «بررسی Ashes of the Singularity و ماجرای DX12» همراه با بنچمارک های این بازی برای DX12 را که در مطلبی به نام «بنچمارک بازی Ashes of the Singularity در DirectX 11 و DirectX 12» منتشر کردیم را مطالعه کنید تادید روشنی در مورد موتور محاسباتی غیرهمگام بدست آورید.

البته سیستم جدید Preemption میتواند به نقطه ضعف معماری جدید انویدیا هم تبدیل شود. یکی از بهینه سازی هایی که به واسطه این بخش صورت گرفته، بهینه سازی و کاهش زمان تاخیر در بخش VR Gaming میباشد. اما مهمترین بخش Preemption ایجاد تعادل پردازشی بین منابع پردازشگر گیمینگ و Compute محور است تا از تمام منابع پردازشی تراشه گرافیکی استفاده مناسبی صورت گیرد و عملکرد کلی را افزایش دهد! اما یکی از محدودیت های Async Compute تحت عنوان «Preemption» این است که استفاده از پیکربندی SLI انویدیا به دو کارت محدود شده است.

این فناوری برای افزایش بازدهی تبادل درونی پردازنده ها از دو رابط اتصال به صورت رفت و برگشت یک یا دو طرفه استفاده می کند تا عملکرد بهتری داشته باشد. این مورد برای افراد زیادی که تنها از یک کارت گرافیک استفاده می کنند مشلی ایجاد نمیکند و شاید اصلا برایشیان اهمیتی هم نداشته باشد. با این حال انویدیا برای حل این معضل از پل جدیدی به نام SLI HB استفاده کرده که بر خلاف نسل قبلی تنها از طریق یک کانکتور SLI میتواند قابلیت اتصال را فراهم کند.

ویژگی های موتور محاسباتی غیرهمگام یا «Asynchronous Compute Engines»

در واقع انویدیا مدعی است زمانی که دو کارت گرافیک نسل پاسکال را به صورت SLI HB در کنار هم قرار دهیم، میتانیم از قدرتی معادل ۴ کارت گرافیک نسل قبلی در حالت ۴Way-SLI بهره مند شویم! با وجود این توضیحات به ای نتیجه میرسیم که افزایش نسبت Shared Memory، Registers و Warps در هر واحد SM را میتوان در زمره مهمترین تغییرات معماری پاسکال در GP100 برشمرد که به واحد های پردازشی SM این امکان را می دهد تا با سرعت و عملکرد بیشتری کدها و دستورات پردازشی را اجرا کنند! در واقع؛ GP100 اولین تراشه پرچمدار انویدیا هست که بخش پردازشی Double Precision آن تقریبا نصف بخش Single Precision هست.

بدین معنا که در نسل دوم معماری ماکسول «Maxwell»، هسته های CUDA از عملکرد FP64 معادل ۳۲:۱ استفاده میکردند و به عبارت دیگر در هر واحد SMM در کنار ۳۲ هسته FP32 با قابلیت پردازشی Single Precision تنها یک عدد هسته FP64 با نقش عملیاتی Double Precision وجود داشته است. با این حال و با توجه به مبحث مهم Async Compute یا موتور محاسباتی غیرهمگام میزان انسجام حافظه ها «Memory coherency» را در پاسکال نسبت به ماکسول کاملا افزایش داشته است.

پاسکال «Pascal» اولین معماری است که از Mixed Precision استفاده میکند و این بدین معنا که مؤلفه های پردازشی همچون FP32 ،FP16 و FP64 با حداکثر بهره وری و بازده خروجی ممکن پردازش میشوند. در مقایسه باید بگوییم که نسل دوم معماری ماکسول «Maxwell» در محاسبات بخش FP32 «بیشتر برای بازی کاربرد دارد» خلاصه شده بود و حالا با حضور پاسکال «Pascal» شاهد قدرت نمایی کارت های گرافیک مبتنی بر این معماری در حوزه های غیر از بازی هم هستیم.

عملکرد واحدهای SM در معماری پاسکال «Pascal» بستگی زیادی به تعداد Thread ها، Warps ها و سایز Registers ها همراه با بیشتر شدن تعداد خود واحد های SM است. تعداد registers ها که مشابه نسل دوم معماری ماکسول «Maxwell» وکپلر «Kepler» است و به همین دلیل بخش اشتراک گذاری حافظه یا «Shared Memory» نیزگ سترش یافته تا بتواند مجموع پهنای باند حافظه اشتراکی را بیشتر کند که البته اینطور هم شده و ما در معماری پاسکال «Pascal» با دو برابر افزایش پهنای باند حافظه اشتراکی مواجه هستیم.

مجموع افزایشی واحدهای فوق به معنای بهبود اجرای دستورات پردازشی است و این دقیقاً همان پیشرفت و بهبود بزرگی است که به نسبت معماری ماکسول شاهدش هستیم. البته هدف اصلی انویدیا با پاسکال «Pascal» تسخیر بازار HPC ها است و به همین دلیل نسبت هسته های CUDA با قابلیت پردازشی Double-Precision را در واحد های SM افزایش داده است. نتیجه آن شده که هر واحد SM سیلیکون GP100 از ۳۲ هسته CUDA با نقش پردازشی FP64 استفاده میکند که نسبت بخش پردازشی Double-Precision به Single-Precision یا FP32 به مقدار ۲:۱ رسیده است. این مقدار در سیلیکون پرچمدار معماری Kepler برابر ۳:۱ است.

در بخش Deep Learning هم شاهدیم که انویدیا ممیزهای شناور ۱۶ بیتی یا FP16 را افزوده و با بهبودهای مختلفی سعی کرده بهترین سازگاری و پتانسیل عملکرد را برای ابزارهای وابسته به هوش مصنوعی فراهم کند. به همین جهت از الگوریتم های محاسباتی IEEE 754‐۲۰۰۸ برای انجام عملیات FMA و از الگوریتم پردازشی FFT در بزرگترین تراشه معماری پاسکال «Pascal» یعنی سیلیکون GP100 و سیلیکون محدود شده کارت گرافیک GeForce GTX 1080 استفاده کرده است.

فناوری های جدید استفاده شده در معماری GeForce GTX 10xx

۱) عصر جدیدی از فناوری Multi-GPU: با معرفی رابط برنامه نویسی DirectX 12 استفاده از پیکربندی ترکیبی Multi-GPU به یک استاندارد تبدیل شده که در آن DirectX 12 میتواند مزیت های زیادی برای برنامه های «App» کاربردی داشته باشد و حالا هر کدام یک از انواع مختلف تراشه های گرافیکی «GPU» به تنهایی میتوانند از ویژگی های API مورد نیاز برنامه ها «App» پشتیبانی کنند. بنابراین پیکربندی Multi-GPU برای همیشه تغییر کرده است. در عوض؛ شامل تراشه های گرافیکی جدیدی هستیم که هزینه زیادی برای طراحی و تولیدش از سوی بخش تحقیقاتی انویدیا صرف شده است.

یکی از مشکلات جدی SLI نسل قبلی این بود که در رزولیشن‌های بالا دچار مشکل می‌شد.بنابراین تجربه استفاده از رزولوشن های بالا در حالت SLI به امری ناخوشایند تبدیل میشد. کمپانی AMD خیلی وقت پیش و از زمان کارت های نسل قبلش وظیفه پل Cross-FireX را به درگاه پرسرعت PCI Express واگذار کرده و درگاه های مربوط به Cross FireX و پل‌های رابطش را حذف کرد. انویدیا نیز برای حل این مشکل از یک SLI دوگانه به نام «فناوری SLI HB» در صدد رفع این مشکل برآمده است.

یکی از راه های انجام این کار استفاده از دو کانکتور به طور هم زمان برای ترکیب کارت های گرافیکی سری پاسکال است. در این حالت، اشکالی که ایجاد میشود این است که با استفاده از این حالت دیگر نمی‌توانید از بیش دو کارت گرافیک SLI شده به صورت همزمان استفاده کنید که این مورد هنوز به صورت رسمی توسط انویدیا تایید نشده است. البته انویدیا مدعی است زمانی که دو کارت گرافیک نسل بعدی را به واسطه پل SLI HB به هم متصل کنید میتوانید از مقدار کارایی همچون ۴Wat-SLI بهره مند شوید، با این تفاوت که تنها دو کارت به همدیگر وصل می شوند.

[su_note note_color=”#f5f7f7″]بررسی فناوری های جدید سری GTX 900 انویدیا[/su_note]

استانداردهای قابل استفاده در پیکربندی ترکیبی Multi-GPU

این بدین معناست که حالت SLI جدید اجازه میدهد از توانایی و پهنای باند بیشتری در رزولوشن های بالایی مثل ۶۰ یا ۱۲۰ فریم ۴K و ۵K یا حتی حالت HDR استفاده کنیم. پل های جدید در سه مدل اسلات ۲، ۳ و اسلات ۴ و با اندازه های ۶۰.۹۶-۶۴،۴۰ و ۸۱.۲۶ میلی متر معرفی شده اند. این پل ها فقط با معماری پاسکال «Pascal» کار میکنند و از پهنای باندی معادل دو برابر پهنای باند پل های SLI موجود در نسل دوم معماری ماکسول «Maxwell» استفاده میکنند. ضمن اینکه هیچگونه سازگاری بین پل های جدید و قدیمی SLI یا Multi GPU وجود ندارد.

فناوری جدید SLI HB قرار است در سه مدل مختلف به بازار عرضه شود و گفته میشود فقط از حالت پیکربندی دو کارته پشتیبانی میکند و خبری از پیکربندی های ۳ و ۴ (یا ۳-Way و ۴-Way) کارته نخواهد بود. در حال حاضر هم درایورهای جدید انویدیا فقط برای بهینه سازی بهتر و بیشتر پیکربندی دو کارته «۲-Way SLI» بروز رسانی میشوند تا بهترین کارایی ممکن را داشته باشند.

۲) فناوری Simultaneous Multi-Projection: با ترکیب فناوری جدید Simultaneous Multi-Projection میتوانیم شاهد رندرینگ به مراتب قدرتمندی برای استفاده از پیکربندی های چند مانیتوره باشیم که میتواند تفاوت بصری بسیار خوبی را به عنوان خروجی نهایی در اختیار مخاطب بگذارد. این فناوری اجازه میدهد تا مخاطب از سه مانیتور صفحه عریض به طور همزمان استفاده کند و با کمک تراشه گرافیکی «GPU» امکان محاسبه حداکثر شانزده زاویه دید دوربین، بدون کوچک‌ترین تاثیر منفی روی کارایی ممکن میشود.

نسل دوم معماری ماکسول «Maxwell» تنها قادر به محسابه یک زاویه دید دوربین بود و حالا این ویژگی به صورت سخت افزاری در معماری پاسکال با پشتیبانی از ۱۶ زاویه دید دوربین قرار گرفته است. فناوری Simultaneous Multi-Projection بدرد افرادی میخورد که از سه مانیتور کنار هم استفاده میکنند. این فناوری به خوبی میتواند لبه های نافرم و تیز را بپوشاند و به همین دلیل است که انویدیا از Simultaneous Multi-Projection یا به اختصار SMP رونمایی کرده تا این مشکل را برطرف کند.

[su_note note_color=”#f5f7f7″]نقاط کوانتومی | با فناوری جدید تلویزیون ها آشنا شوید[/su_note]

شکل شماتیک نحوه کارکرد فناوری Simultaneous Multi-Projection

شاید دقت کرده باشید اگر مانیتورهای کناری با زوایه از مانیتور میانی قرار گیرند، تصویر دچار شکستگی شده و زاویه اشیاء درون تصویر مانیتورهای کناری با مانیتور میانی منطبق نمی شود. به همین دلیل از فناوری Simultaneous Multi-Projection رونمایی شده و با این ویژگی میتوانید از طریق پنل درایور مخصوص انویدیا، زاویه تصویر مانیتور ها را تنظیم کنید تا اگر سه مانیتور راکنار هم قرار دادید با پدیده شکستگی تصاویر مواجه نشوید.

در واقع این فناوری مخصوص مانیتورهای خمیده است که وقتی سه عدد از آنها را کنار هم میگذاریم، تصویری که درون آنها پخش میشود، حالتی شکسته دارد. از طرفی این فناوری برای واقعیت مجازی «VR» هم عالی است و از آنجایی که این فناوری در سطح سخت افزاری تعبیه شده، امکان استفاده از آن برای کارت های نسل قبل وجود ندارد. بنابراین از نظر استفاده از واقعیت مجازی «VR» هم به کارت هایی میرسیم که ارزش خرید بسیار بالایی دارند.  انویدیا برای نمایش این ویژگی در مراسم معرفی GTX1080 از دموی بازی Cyan Worlds’s Obduction در رزولوشن ۴K استفاده کرد که ویژگی SMP را به خوبی به نمایش گذاشت.

۳) کانکتورهای خروجی تصویر نسل جدید: معماری پاسکال «Pascal» از DisplayPort 1.4 استفاده میکند که با تمام نسخه های قبلی این کانکتور سازگار است که از جمله آنها میتوان به متا دیتاهای HDR اشاره کرد. تمام تراشه هایگرافیکی «GPU» مبتنی بر معماری پاسکال از HDMI 2.0 هم پشتیبانی میکنند که به طور اختصاصی برای پشتیبانی از رزولوشن ۴K طراحی شده است و در کمترین حالتش میتواند از HDR پشتیبانی کند. انویدیا هنوز مشخص نکرده که معماری پاسکال «Pascal»  از فناوری VESA Adaptive Sync پشتیبانی میکند یا خیر! این فناوری در AMD به FreeSync مشهور است.

[su_note note_color=”#f5f7f7″]با کانکتور های نسل جدید آشنا شوید[/su_note]

کانکتور جدید HDMI 2.0

پشتیبانی از موارد فوق توسط درایورهای انویدیا صورت میگیرد و از خروجی های تایید شده GTX 1080 میتوان به پشتیبانی از HDMI 2.0b، کانکتور منقرض شده DVI-D و سه کانکتور DisplayPort 1.4 برای پشتیبانی بهتر از ۴K در حالت SLI HB و پیکربندی ترکیبی Multi-GPU میباشد. لازم به ذکر است که کانکتور DVI فاقد سیم کشی آنالوگ است و به همین دلیل کارت گرافیک GTX 1080  نمیتواند با دانگل از مانیتورهای D-Sub پشتیبانی کند

۴) فناوری Fast Sync: انویدیا در هر معماری جدیدی که عرضه میکند، از فناوری همگام سازی «Sync» جدیدی هم رونمایی میکند که اینبار به Fast Sync معروف شده است. در معماری کپلر «Kepler» با فناوری Adaptive V-Sync آشنا شدیم، در نسل دوم معماری ماکسول «Maxwell» با G-SYNC آشنا شدیم و حالا در معماری پاسکال «Pascal» با فناوری همگام سازی Fast Sync مواجه ایم. انویدیا بیان کرده Fast Sync بهترین جایگزین V-Sync با زمان تاخیر کم، برای حذف پارگی فریم «Frame-Tearing» (که معمولاً به دلیل خروجی فریم ریت بیشتر تراشه گرافیکی به نسبت نرخ تازه سازی مانیتور ایجاد میشود) است.

مقایسه فناوری Fast Sync با نسل قبلش

این حالت جایگزین باعث میشود تراشه گرافیکی «GPU» به صورت نامحدودی V-Sync را رندر کند که نتیجه آن کاهش زمان تاخیر ورودی است. این کار با تجزیه و تحلیل خط لوله صفحه نمایش «Display Pipelines» و خروجی رندرینگ «Render Output» صورت میگیرد که باعث میشود به طور موقت فریم ریت زیادی به عنوان فریم بافر ذخیره شود. به واسطه V-Sync خاموش نتیجه آن میشود یک خروجی با لَگ یا تاخیر بسیار پایین و بدون هیچگونه پارگی فریم «Frame-Tearing» در زمان استفاده از روشن بودن V-Sync.

[su_note note_color=”#f5f7f7″]انویدیا G-Sync چیست؟![/su_note]

تاخیر بسیار کم فناوری Fast Sync

به هر حال امکان فعال سازی فناوری Fast Sync برای برنامه های سه بعدی با ویرایش مشخصات پروفایل درایور کنترل پنل انویدیا فراهم شده است تا کاربران مختلف بنا بر نیازشان از این حالت استفاده کنند.

۵) فناوری اَنسِل «Ansel»: ویژگی Ansel دوربینی آزاد در بازی در اختیار بازیباز قرار می‌دهد تا از صحنه‌های مختف دلخواه در بازی‌های بزرگ عکس‌های بسیار با کیفیتی با رزولوشن ۶۱۴۴۰ در ۳۴۵۶۰ پیکسل تهیه کند!

۶) فناوری HDR takes Center stage: دامنه دینامیک بالا «High Dynamic Range» و یا به طور خلاصه همان HDR برای اولین بار با افکت Bloom در اوایل سال ۲۰۰۰ و با موتور بازی سازی Valve به نمایش درآمد. در آن زمان تمام برنامه ها از محدودیت ۲۴ بیتی جعبه رنگ (۸ بیت در هر رنگ و ۱۶ میلیون رنگ در مجموع) برای شبیه سازی HDR برخوردار بودند. ولی پهنای کارت های گرافیک قدرتمندی همچون GTX 1080 موجب شده تا این کارت ها بتوانند به صورت واقعی «Native» از جعبه های رنگ ۱۰ بیتی (معادل ۱.۰۷ بیلیون رنگ) و ۱۲ بیتی (۶۸.۷ بیلیون رنگ) برای سرعت بخشیدن به محتوای HDR استفاده کنند.

دامنه دینامیک بالا «High Dynamic Range» و یا به طور خلاصه همان HDR

لازم به ذکر است که ین کار بدون هیچگونه نرم افزار شبیه سازی انجام میشود و شامل پشتیبانی از رمز گشایی «Decoding» قدرتمند ۱۰ و ۱۲ بیتی کدک HVEC برای رزولوشن های بالایی همچون ۴K در حالت ۶۰ فریم بر ثانیه میباشد، یا حتی برای «Encoding» یا رمز گذاری ۱۰ بیتی همان رزولوشن هم مورد استفاده قرار میگیرد.

۷) فناوری GPU Boost 3.0: در این مورد اطلاعات زیادی در دست نیست. ولی به طورکلی؛ اساس کار GPU Boost اینطور است که هر وقت توان مصرفی تراشه گرافیکی «GPU» کم باشد، فرکانس کاری افزایش میابد و زمانی که مصرف برق افزایش یافت، فرکانس کاری به مقدار فرکانس از پیش تعیین شده یا همان کلاک پایه «Base» تقلیل میابد. این کار فقط برای ایجاد تعادل بین مصرف برق و فرکانس تراشه گرافیکی «GPU» انجام میشود. در کارت های گرافیک انویدیا افزایش فرکانس بوست بر مبنای «Step ها» انجام میشود که هر Step حدود ۱۳ مگاهرتز است.

۸) فناوری SLI HB: در کارت های جدیدی سری ۱۰۰۰ انویدیا شاهد معرفی پل جدیدی به نام SLI HB بودیم که قرار است جایگزین پل SLI نسل گذشته شود. برخلاف نسل فعلی که کارت های گرافیکی که تنها از طریق یک کانکتور SLI به هم متصل می شوند، SLI HB از دو کانکتور به طور هم زمان استفاده میکند و زمانی که دو کارت گرافیک نسل بعدی را به واسطه پل SLI HB به هم متصل کنید میتوانید از مقدار کارایی همچون ۴Wat-SLI بهره مند شوید، با این تفاوت که تنها دو کارت به همدیگر وصل می شوند.

پل های جدید فناوری SLI HB

۹) لیتوگرافی ۱۶ نانومتری FinFET: کارت گرافیک GTX 1080 اولین کارتی است که با فناوری ۱۶ نانومتری FinFET ساخته میشود و علاوه بر کوچک بودن، از ترانزیستورهای سریعتر و باتراکم بیشتر استفاده میکند. در این کارت از ۷.۲ بیلیون ترانزیستور استفاده شده که میتواند افزایش چشمیگری در عملکرد و بهره وری نهایی داشته باشد.FinFET یک ترانزیستور با معماری سه بعدی است که می‌تواند با مصرف انرژی کمتر، کارایی بالاتری داشته باشد. از این ترانزیستور در ساخت تراشه‌های موجود در تلفن‌های همراه و کامپیوترها استفاده می‌شود. طراحی و ساخت این ترانزیستورهای سه بعدی از همتایان مسطح (دو بعدی) خود پیچیده‌تر است.

معماری FinFET به دلیل هدایت گرمایی کمتر، گرمای بالاتری تولید می‌کند که این روش افزایش دما و احتمال بروز پدیده «الکترومایگریشن» را در سیم‌های نازک افزایش داده و عمر قطعات الکترونیکی را کاهش می‌دهد. منتهی ترانزیستورهایی با این روش از ساختار عملکرد بسیار بالایی برخوردارند و به همین دلیل است که در هر دو کارت گرافیک نسل جدید انویدیا پاسکال GTX 1080 و GTX 1070 از این فناوری برای تولید کارت های جدید استفاده شده است.

۱۰) حافظه های پیشرفته GDDR5X: تراشه های گرافیکی مبتنی بر معماری پاسکال «Pasca» را میتوان اولین تراشه های گرافیکی نامید که از حافظه های ویدئویی تکامل یافته GDDR5X استفاده میکنند. کارت گرافیک GTX 1080 از ۸ گیگابایت حافظه GDDR5X همراه با یک گذرگاه ۲۵۶ بیتی استفاده میکند که میتواند پهنای باندی معادل ۱۰ گیگابیت بر ثانیه (۳۲۰ گیگابایت) را منتقل کند. این مقدار ۱.۷ برابر بیشتر از پهنای باند موثر حافظه های GDDR5 است.

بررسی کارت گرافیک GeForce GTX 1080 8GB

با باز کردن بسته بندی کارت گرافیک GTX 1080 به اولین چیزی برخورد میکنیم، تغییر طراحی کولر جدیدی است که از طرح چند ضلعی استفاده میکند. در پشت کارت یک صفحه فلزی «Backplate» بسیار نازک برای جلوگیری از ورود گرد و غبار و افزایش میزان خنک کنندگی و کولر نصب شده که به خوبی توانسته تمامی سطح کارت را پوشش داده و البته کمی از آن قابلیت جدا شدن از پشت کارت را دارد. با این حساب میتوان گفت که ابعاد کارت رقمی معادل ۲۷.۰ سانتی متر طول و ۱۱.۰ سانتی متر عرض میباشد.

ابعاد کارت موجب شده برای نصبش در کیس به فضایی معادل دو اسلات نیاز باشد. از خورجی های تصویری GeForce GTX 1080 هم میتوان به یک پورت DVI، یک HDMI و سه DisplayPorts اشاره کرد. متاسفانه بر خلاف کارت های قبلی انویدیا، پورت DVI نصب شده روی این کارت از سیگنال آنالوگ پشتیبانی نمیکند و به همین دلیل برای استفاده از این پورت به آداپتورهای فعال مخصوص نیاز دارید. همچنین پوتر DisplayPort to be 1.2 برای سازگاری بیشتر با نسخه های جدیدتر به ۱.۳/۱.۴ آپدیت شده تا برای پشتیبانی از رزولوشن هایی مثل ۴K (سرعت ۱۲۰ هرتز) و ۵K (سرعت ۶۰ هرتز) و یا ۸K (سرعت ۶۰ هرتز) آماده باشد.

تراشه گرافیکی «GPU» استفاده شده در این مدل نیز مثل کارت های نسل قبل به صورت سخت افزاری از کدک صوتی HDMI سازگار با HDMI 2.0 استفاده میکند و میتواند از تمام ویژگی های صدای اچ دی «HD audio» و فیلم های سه بعدی «Blu-ray 3D» پشتیبانی کند. لازم به ذکر است که رمزگشای ویدئویی هم به نسخه های ۱۰ و ۱۲ بیتی HEVC بروز شده که میتواند ویدئوهای ۴K را با سرعت های متفاوتی رمزگشایی/رمزگذاری کند. در زمینه پل SLI نیز با تغییراتی مواجه بودیم که پیش از در دو مقاله «بررسی اولیه کارت های گرافیک انویدیا GTX 1070 و GTX 1080» و «GTX1080 یا GTX1070؛ کدام یک برای بازی به صرفه است؟!» درموردش توضیحات مفصلی دادیم.

به طور خلاصه؛ برای رزولوشن ۴K در حالت ۶۰ هرتزی (همون ۶۰ فریم) و بالاتر انویدیا توصیه میکند از پل SLI جدیدی که به «SLI HB» معروف شده استفاده کنید تا از پهنای باندی دو برابر بیشتر از مدل های قبلی بهره مند شوید. از طرفی استفاده از مدل های سنتی ۳Way-SLI و ۴Way-SLI هم امکان پذیر است که البته انویدیا برای کارت های جدیدش پیشنهاد نمیکند. در واقع شما در هر رزولوشن و فریم ریتی نمیتوانید از SLI HB استفاده کنید و برای استفاده از ۴K (سرعت ۱۲۰ هرتز) به این نوع پل SLI نیاز پیدا خواهید کرد.

لازم به ذکر است برای استفاده از حالت ۳Way-SLI و ۴Way-SLI باید از طریق وب سایت انویدیا کد مخصوص این کار را دریافت کنید و سپس از طریق کنترل پنل مخصوص درایور انویدیا آن را وارد کنید تا استفاده از این پل در کارتهای سری GTX 100 انویدیا برای شما آزاد شود. بنابراین از همین الان میتوانیم بازار سودجیان بزرگی را در ایران پیش بینی کنیم که با گرفتن هر کلید از وب سایت انویدیا پول بی زبان زیادی را از جیب مشتری از همه جا بی خبر خارج میکنند!

در زمینه خنک کننده شاهدیم که انویدیا از خنک کننده جدیدی برای کارت گرافیک GeForce GTX 1080 8GB استفاده کرده که به خوبی تمام اجزایی مثل تراشه گرافیکی «GPU»، تراشه حافظه ویدئویی و مدار تظنیم ولتاژ «Voltage Regulation Circuitry» را پوشش میدهد. برای رتاشه گرافیکی از یک محفظه بخار «vapor chamber» جداگانه استفاده شده که میتاند به سرعت گرمای موجود را جذب کند. همانطور که قبلاً اشاره کردیم؛ GTX 1080 از صفحه فلزی «Backplate» بسیار نازکی استفاده میکند که در حالت استفاده از پیکربندی SLI میتواند جریان هوای بیشتری را منتقل کند.

طراحی صفحه فلزی «Backplate» جدید به گونه ای است که حتی اگر بخواهید جریان هوای بیشتری داشته باشید مشکلی نخواهید داشت، چون صفحه فلزی جدید از دو بخش مجزا و قابل تفکیک از هم طرحی شده و قابلیت جداسازی را دارد. لازم به ذکر است که صفحه فلزی روی تراشه گرافیکی «GPU» از سه پد حرارتی «Thermal Pads » مخصوص استفاده میکند که میتواند اجزای ضخیم تر را برای حافظت بهتر از مدارات کوچک تر محافظت کند. به همین دلیل طراحی سیستم خنک سازی GTX 1080 مدل مرجع فوندر ادیشن «Founders Edition» بسیار بهتر از مدل های پیشین این کمپانی است و گردش هوای بهتری دارد.

انویدیا برای تامین برق مورد نیاز GTX 1080 برای اولین بار از یک کانکتور ۸ پینی استفاده است، در حالی که نسخه های قبلی این کارت از یک کانکتور ۶ پینی استفاده میکردند، بنابراین از نظر اتصال برق با کار سخت و دشواری مواجه نیستیم و به راحتی میتوانید برق مورد نظر را مسیر یابی و متصل کنید. خروجی موردنظر توان دریافت توان برقی معادل ۲۲۵ وات بر ساعت را دارد و به همین دلیل میتوان گفت کارت گرافیک GTX 1080 از پتانسیل اورکلاکینگ مناسبی برخوردار است و قطعاً در نمونه های غیر مرجع با کارت هایی به مراتب قدرتمندتر از کارت مرجعمواجه خواهیم شد.

انویدیا برای این کارت چیپ کنترلر ولتاژ جدیدی به نام uP 9511P استفاده کرده است و به همین دلیل معلوم نیست از چه ویژگی هایی استفاده میکند. همچنین حافظه های ویدئویی GDDR5X ای که در صحات قبلی در موردش صحبت کردیم توسط توسط کمپانی Micron تولید شده و با مشخصه تجاری «Z9TXT» به ثبت رسیده و از اسم رمز MT58K256M32JA-100 استفاده میکند. این حافظه از سرعت کلاک ۱۲۵۰ مگاهرتزی (۱۰,۰۰۰ مگاهرتز موثر) استفاده میکند واز دو برابر پهنای باند بیشتری به نسبت GDDR5 های قدیمی برخوردار است.

سیلیکون GP104 هم به عنوان قلب تپنده کارت گرافیک GTX 1080 اولین تراشه گرافیکی مبتنی بر معماری پاسکال «Pascal» است که با لیتوگرافی ۱۶ نانومتری کمپانی تایوانی TSMC تولید شده و از ۷.۱ بیلیون ترانزیستور در مساحتی به ابعاد ۳۱۴ میلیمتر مربع استفاده میکند. نتایج بنچمارک کارت گرافیک GTX 1080 را در صفحات بعدی ببینید.

مقایسه فریم ریت GTX Titan X و GTX 980 Ti و Radeon R9 Fury X در رزولوشن ۴K

اجرای بازی در رزولوشن ۴KTitan XGTX 980 Ti Radeon Fury X
Battlefield (High, Post-AA)۶۱.۳۶۱۵۱
Crysis 3 (High, SMAA) ۵۲.۴۵۲.۵۴۹.۲
Assassin’s Creed Unity (Very High, FXAA)۲۷.۴۲۶.۵۲۵.۵
Far Cry 4 (Very High, SMAA) ۴۶.۷۴۷.۱۵۰.۵
COD Advanced Warfare (Console Settings, FXAA)۹۰.۸۸۶.۹۸۵.۳
Ryse: Son of Rome (Normal, SMAA)۴۲.۳۴۱.۷۴۴
Shadow of Mordor (High, High Textures, FXAA)۵۴.۸۵۴.۸۵۵.۵
The Witcher 3: Wild Hunt ( High, HairWorks Off, Custom AA)۳۷.۵۳۶.۹۳۶.۲
Tomb Raider (Ultra, FXAA)۶۴.۶۶۱.۳۶۳.۹

سیستم بنچمارک کارت گرافیک NVIDIA GeForce GTX 1080 8 GB

پردازندهIntel Core i7-6700K @ 4.5 GHz - Skylake, 8192 KB Cache
مادربردASUS Maximus VIII Hero Intel Z170
حافظه رمG.SKILL 16 GB Trident-Z DDR4-3000 با تایمینگ ۱۵-۱۶-۱۶-۳۵
هارد دیسکWD Caviar Blue WD10EZEX 1 TB
منبع تغذیهAntec HCP-1200 1200W
خنک کنندهCryorig R1 Universal 2x 140 mm fan
سیستم عاملویندوز ۱۰ نسخه ۶۴ بیتی
درایورNVIDIA: 365.10 WHQL
AMD: Crimson 16.4.2 Beta
GTX 1080: 368.16 Beta
مانیتور Acer CB240HYKbmjdpr 24" 3840x2160
۱۶۰۰x900
۱۹۲۰x1080
۲۵۶۰x1440
۳۸۴۰x2160
مناسب برای لپ تاپ های ۱۷ و ۱۹ اینچ
مناسب برای مانیتورهای ۲۲ تا ۲۶ اینچ
استاندارد ۱۶:۹ و مناسب برای مانیتورهای ۲۷ تا ۳۲ اینچ
۴K Ultra HD و مناسب برای مانیتورهای بزرگتراز ۳۲ اینچ
فیلترهای مورد استفادهاستفاده از AA و AF از طریق تنظیمات بازی
استفاده از سطح تنظیمات highest quality
استفاده از ۴x Anti-aliasing در تمامی کارت ها
استفاده از DirectX 11 در تمامی تست ها

 

به عنوان اولین کارت قدرتمند این نسل؛ میتوان به راحتی فهمید که GTX 1080 فعلاً قویترین کارت گرافیک تک هسته ای جهان است و در تمام بازی های ۴K میتواند به عنوان قویترین کارت گرافیک تک هسته ای جهان در بالاترین رده قرار بگیرد. تست های بالا نشان میدهد GTX 1080 به عنوان یک کارت کاملاً جدیدفاصله خوبی یا دیگر رقبایش دارد، به طوری که با وجود جاگزینی برای GTX 1080 در عمل ۳۱% سریعتر از GTX 980 Ti و ۳۲% هم سریعتر از پرچمدار نسل گذشته AMD یعنی Radeon R9 Fury X میباشد.

اما اگر بخواهیم این مقایسه را در مقابل GTX 980 انجام دهیم باید بگوییم که GTX 1080 از سلف پیشینش ۷۰% سریعتر است. این تفاوت  مقدار عملکرد بین دو نسل از کارت های گرافیکی مثل GTX 680 و GTX 980 حدود ۷۴% است و همین روند در نار قیمت بسیار مناسب GTX 1080 نشان میدهد انویدیا فقطبه دنبال جایگزینی این کارت با کارت های نسل قبل نبوده و در صدد یک ارتقا معماری و جهش فناوری بزرگ در نسل جدید بوده که خوب تقریباً هم در کارش موفق بوده است.

GTX 1080 یک ارتقا خوب برای GTX 980 است و یادتان باشد تنها ۲۰ ماه پس از عرضه GTX 980 و نسل دوم معماری ماکسول «Maxwell» عرضه شده است.

این تست در رزولوشن ۱۰۸۰p انجام شده و همانطور که میبینید؛ GTX 1080 با ۱۰۰ فریم بر ثانیه و با اختلاف ۳۰ فریمی به نسبت قویترین کارت گرافیک ۲۸ نانومتری نسل قبلی انویدیا در صدر جدول ایستاده و مناسب افرادی است که میخواهند بازی های مختلف را با سرعت فریم بالا روی مانیتورهای ۱۰۸۰p تجربه کنند. در این تست، GTX 1080 حدود ۳ برابر بهتر از GTX 680 و Radeon HD 7970 عمل میکند. این به معنای بهره وری بسیار خوب معماری جدید انویدیا است که به نسبت نسل دوم معماری ماکسول «Maxwell» از فاکتور بهره وری بالاتری استفاده میکند. در واقع جهش بزرگی که با GTX 1080 شاهدش هستیم مثل پرش از فناوری ساخت ۵۰ نانومتری به ۴۰ و ۴۰ به ۲۸ است

بنچمارک مصرف برق کارت گرافیک GTX 1080

در مصرف برق هم با کارت بسیار خوبی مواجه ایم. کارتی که در زمان اجرای بازی Crysis 3 نزدیک ۲۰ وات کمتر از GTX 980 و یا ۵۲ وات کمتر از GTX 980 Ti مصرف برق دارد. به صورت کلی با مصرف برق بسیار کمی مواجه ایم. ولی همین مقار بیش از تحمل کلی کارت گرافیک GTX 1080 است. نتیجه نهایی است که از نظر مثرف برق، GTX 1080 کمی گرسنه تر از GTX 980 است. به هر حال؛ این مقدار مصرف برق را میتوان باز هم نقطه قوتی برای کارت گرافیک GTX 1080 محسوب کرد که در بازار گیمینگ از اهمیت بسیاری برخوردار است.

به طور کلی؛ این مقدار ۵۴% افزایش عملکرد بهره وری بیشتر در بازی Crysis 3 است.

بنچمارک حرارت کارت گرافیک GTX 1080

بنچمارک نویز (سر و صدا) کارت گرافیک GTX 1080

دو تست اخیر نشان میدهد مقدار دما یا حرارت GTX 1080 با کارت های گرافیک سری ماکسول تفاوت چندانی ندارد. بنابراین همواره با دمای باری کمتر از ۸۰ درجه سانتی گراد مواجه ایم. از نظر نویز کارت هم بایداشاره کنیم که در نویز صدای ۴۷.۵ دسیبل، با کمی سر و صدای مواجه ایم که از این جهت با GTX 780 و کمتر از نصفش با GTX 980 همتراز میشود. به هر حال انویدیا GTX 1080 را به عنوان جایگزینی برای GTX 980 در نظر گرفته شده و داده های فوق نشان میدهد افزایش عملکرد کارت گرافیک  GTX 1080 با اندکی افزایش مصرف برق همراه بوده، بدون آنکه تغییر معنا داری در دمای آکوستیک کارت به وجود اید.

تحلیل نهایی و راهنمای خرید کارت گرافیک GTX 1080

انویدیا با کاهش تراکم هسته های CUDA در واحد های SM و تفکیک هر واحد SM به دو بخش مجزا شرایط مصرفی و تنفسی بسیار خوبی را برای ریز پردازنده های خود فراهم کرده است. این عمل موجب افزایش دو برابری عملکرد کارت شده و از طرفی کارت میان رده GTX 1070 مبتنی بر پاسکال GP104 هم موفق شده حریفان نسل قبلی خودش را به زانو زدن وادار کند. نتایج و تست ها نشان میدهد معماری پاسکال «Pascal» موفق شده بهره وری عملکرد بی نظیری برای کارت های این سری فراهم کند و این مقدار به قدری بالاست که برای اولین بار میتوانیم با کارت های گرافیک سری پاسکال به فرکانس شگفت انگیز ۲ گیگاهرتز بر ثانیه برسیم.

معماری پاسکال «Pascal» در مقابل نسل دوم معماری ماکسول «Maxwell» و حتی کپلر از قدرت بهره وری، انرژی کمتر و عملکرد بسیار سریعتری استفاده میکند که باترجمه اعداد و ارقامش، حداقل بر روی کاغذ به اینت نتیجه میرسیم که GTX 1080 در رزولوشن ۴K به مقدار ۳۰% سریعتر از GTX 980 Ti و R9 Fury X و به مقدار ۷۰% سریعتر از GTX 980 است که در مقایسه با نسل دوم معماری ماکسول «Maxwell» جهش بسیار عظیمی محسوب میشود. از طرفی ترکیب استفاده از دو کارت GTX 970 SLI هم نتیجه خاصی ندارد و این دو کارت در مقابل قدرت GTX 1080 از نظر فاکتور قیمت به کارایی به شدت له میشوند!

استفاده از فناوری ساخت ۱۶ نانومتری هم به خودی خودش موجب افزایش عملکرد کارت شده و موجب به بهره وری بسیار بالایی از این هیولا مواجه شویم. در واقع GTX 1080 کارآمدترین کارت گرافیکی است که انویدیا تاکنون ساخته است. ازنظر مصرف برق، در طول تست بسیاری از عناوین سنگین با مصرفی معادل ۱۸۰ وات بر ساعت مواجه شدیم که این مقدار چیزی معادل مصرف برق GTX 980 است که در صفحه قبل هم به آن اشاره کردیم.

این مقدار مصرف برق بسیار کم در مقابل ۷۰% قدرت و عملکرد بیشتر از GTX 980 موجب شده با هیولایی بی نظیر از منظر کارایی و بهره وری مواجه شویم که ارزش خریدش را بیش از هر چیزی افزایش داده است. استفاده از فناوری جدیدی مثل Boost 3.0 موجب شده حداقل در زمینه اورکلاکینگ هم با امکانات بهتری مواجه شویم تا امکان افزایش فرکانس هسته کارت به خوبی فراهم باشد. در برخی تست های انجام شده توسط وب سایت های مختلف، با افزایش اروکلاکینگ، دستاوردهای قابل توجهی کسب شده که افزایش عملکرد ۱۰ درصدی فرکانس حافظه ویدئویی و فرکانس هسته کارت را میتوان در این زمینه دانست.

با این حال و حداقل روی کاغذ، با اورکلاکینگ بعید به نظر میرسد GTX 1080 بتواند عملکردی دو برابر یا به عبارتی ۵۰ درصدی در مقابل GTX 980 Ti داشته باشد. همانطور که در ابتدای مقاله هم اشاره کردیم؛ قیمت نسخه GeForce GTX 1080 Founder’s Edition حدود ۱۰۰ دلار بیشتر از قیمت نسخه شرکا است و دلیل آن را هم به طور شفاف توضیح دادیم که بهتر است به صفحه اول برگردید و مجددا نگاهی به آن بیدازید. این نسخه از کارت واقعا در مقابل نسخه های سفارشی شده دیگر برندها ارزش خرید واقعی چندانی ندارد.

[su_note note_color=”#f5f7f7″]گزارش و تحلیل | بزرگترین اشتباه AMD در جنگ با انویدیا کجا بود!؟[/su_note]

نسخه پایهنسخه Founders Edition
کلاک هسته۱۶۰۷ مگاهرتز۱۶۰۷ مگاهرتز
کلاک بوست (کمکی)۱۷۳۳ مگاهرتز۱۷۳۳ مگاهرتز
کلاک حافظه۱۰ گیگاهرتز موثر GDDR5X۱۰ گیگاهرتز موثر GDDR5X
خنک کنندهقابلیت سفارشی سازی با ۲ یا ۳ فن را داردفقط باید از خنک کننده مرجع استفاده شود
تاریخ عرضهاحتمالاً ۱۲ خرداد ۱۳۹۵ ۷ خرداد ۱۳۹۵
قیمت عرضه۵۹۹ دلار۶۹۹ دلار

در واقع تفاوتی بین نسخه Founder’s Edition و دیگر نسخه های سفارشی شده نیست و این کار فقط برای افزایش فروش نسخه مرجع Founder’s Edition توسط انویدیا صورت گرفته تا شرکا و خود تولید کننده (انویدیا) از سهم فروش یکسانی در بازار کارت های گرافیکی برخوردار باشند. اما نکته ای که وجود دارد این است که تمام کارت های نسخه Founder’s Edition باید بدون هیچگونه تغییر ظاهری و حذف خنک کننده و افزایشی فرکانس هسته و … به فروش برسند که احتمالا در این صورت معادل ۷۰۰ دلار خواهند شد.

از طرفی به کارت های GeForce GTX 1080 غیر نسخه Founder’s Edition میرسیم که قابلیت افزایش کلاک، تغییر بُرد، تغییر کولر و … را دارند و میتوانند به صورت کاملا سفارشی توسط شرکای انویدیا تولید و روانه بازار شوند منتهی قیمت این کارت ها ۵۹۹ دلار است و با تغییرات صورت گرفته در آنها ممکن است با قیمتی بیش از ۷۰۰ دلار روانه بازار شوند! این یعنی زدن دو نشان با یک تیر توسط انویدیا! به هر حال؛ ما در مقاله بسیار مفصل «GTX1080 یا GTX1070؛ کدام یک برای بازی به صرفه است؟!» در مورد ارزش خرید GeForce GTX 1080 صحبت های زیادی کردیم و راهنمایی لازم را ارائه کردیم.

بنابراین با توجه به قیمت و کارایی دور از انتظار و بسیار بالایی که GTX 1080 دارد؛ قطعاً خریدش به صرفه است. البته در کنارش نیز باید یک سیستم کاملاً جدید جمع آوری کنید که خوب کمی هزینه بر است و ممکن است فعلاً نیازی نباشد. البته GTX 1080 هنوز عرضه نشده و فعلاً برای تست و بنچمارک در اختیار مدیاهای مختلف قرار گرفته است. با این حال از همین الان میتوانیم در مورد قیمت تخیلی و بیش از گرانش در بازار ایران مطمئن باشیم و چه بسا که برای گرفتن کد مخصوص SLI HB از خریداران از همه جا بی خبر پول های زیادی بالا کشیده نشود!

[su_note note_color=”#f5f7f7″]بهترین کارت های گرافیک انویدیا و AMD در هر رنج قیمت[/su_note]

بنابراین به تمام خریداران GTX 1080 توصیه میکنیم به هیچ وجه گول فروشندگان سودجو بازار رضای تهران و دیگر بازارهای کامپیوتری را نخورند و صبر کنند تا زمانی که قیمت کارت های سری ۱۰۰۰ انویدیا به قیمت معقولی رسید خریدشان را انجام دهند.

مقایسه قیمت کارت های گرافیک قدرتمند انویدیا و AMD

AMDقیمتانویدیا
۶۹۹ دلار (۲.۳۸۰.۰۰۰ تومان)GeForce GTX 1080 FE
Radeon R9 Fury X۶۰۹ دلار (۲.۰۷۴.۶۰۰ تومان)
۵۸۹ دلار (۲.۰۰۶.۰۰۰ تومان)GeForce GTX 980 Ti
۴۲۹ دلار (۱.۴۶۲.۰۰۰ تومان)GeForce GTX 980
Radeon R9 390X۳۹۹ دلار (۱.۳۶۰.۰۰۰ تومان)
Radeon R9 390۲۸۹ دلار (۹۸۶.۰۰۰ تومان)GeForce GTX 970
خروج از نسخه موبایل