بررسی فنی معماری تراشه گرافیکی Pascal GP106

بررسی کوتاه معماری پاسکال «Pascal»

GTX 1060 را میتوان همان GTX 960 نسل قبل دانست که از ASIC با کیفیت تری استفاده میکند. در اینجا ASIC نوعی معیار سنجش برای بیان کیفیت سیلیکون مورد استفاده در کارت گرافیک GTX 1060 میباشد که هر چه قدر کیفیتش بهتر باشد؛ از ولتاژ پایدارتر، مصرف انرژی کمتر، بهره وری بیشتر و پتانسیل اورکلاکینگ بهتری استفاده میکند که البته خود فاکتور اورکلاکینگ هم به طور مستقیم به دو فاکتور «ولتاژ» و «مصرف انرژی» مرتبط است و هر چه قدر دو فاکتور فوق بهینگی بیشتری داشته باشند، با مقدار اورکلاک بیشتری مواجه میشویم.

GTX 1060 از سیلیکون یا تراشه گرافیکی Pascal GP106 استفاده میکند که تقریباً میتوانیم بگوییم همان سیلیکون موفق و خوش نام GM206 استفاده شده در کارت پر طرفدار GTX 960 است. GTX 1060 همچون دو برادر بزرگترش با لیتوگرافی ۱۶ نانومتری FinFET تولید شده و ابعاد بسیار کوچکی دارد که اگر بخواهیم مساحتش را محاسبه کنیم به رقمی معادل ۲۰۰ میلیمتر مربع میرسیم که حیرت انگیز است! مهندسین انویدیا موفق شده اند در این مساحت بسیار کم از ۴.۴ بیلیون ترانزیستور استفاده کنند که به نسبت سیلیکون GM206 شاهد افزایش قابل توجه تعداد ترانزیستورها به رقم ۲.۹۴ بیلیون هستیم که بی نظیر است!

پس از معماری فرمی «Fermi» بود که انویدیا با عرضه معماری جدیدتر؛ پردازنده های چند جریانی «Streaming Multiprocessor» یا (همان واحد های SM) را با افزودن منابع اختصاصی بیشتر افزایش داد و از طرفی منابع مشترک درون موتور GPC یا «Graphics Processing Cluster» (خوشه های سبز رنگ درون معماری تراشه های گرافیکی) را کاهش داده که نتیجه آن افزایش عملکرد بسیار بالای کارت های گرافیک جدیدتر این کمپانی است. این داستان همچنان تا جدیدترین و آخرین معماری گرافیکی انویدیا یعنی پاسکال «Pascal» هم ادامه دارد و همچون تراشه های قبل از GM206؛ سیلیکون یا تراشه گرافیکی Pascal GP106 نیز از دو موتور GPC استفاده میکند.

موتور-GigaThread

این دو موتور شامل زیر واحدهای تخصصی میشوند که در حالت کلی موجب به اشتراک گذاری ویژگی هایی همچون PCI-Express 3.0 x16، گذرگاه حافظه گرافیکی ۱۹۲ بیتی مبتنی بر فناوری GDDR5 و شش واحد کنترلر حافظه است که بخشی از اجزای سیلیکون Pascal GP106 را فراهم آورده اند. تمام حجم کاری دو موتور GPC با موتور GigaThread به اشتراک گذاشته میشود که به حافظه های فوق سریع L2 مجهز شده است. هر کدام یک از موتورهای GPC از ۵ واحد پردازنده چند جریانی «Streaming Multiprocessors» یا SM تشکیل شده که به نسبت سیلیکون GM206 با افزایش ۴ واحدی در هر موتور GPC مواجه ایم.

لازم به ذکر است هر واحد SM از ۴ واحد بلوک پردازشی با ۳۲ هسته کودا «CUDA» از نوع Single-Precision FP32، بافر های دستورالعمل «Instruction Buffer»، پیچیدگی های زمانبندی «Warp Scheduler» و واحد های ارسال «Dispatch Units» تشکیل شده است. همچنین تعداد ریجستر فایل های «Register File» معماری پاسکال «Pascal» کاملاً مشابه با معماری نسل های قبلی انویدیا است و دقیقاً به همان صورت از Warp خت و رشته بلوک های پردازشی «Thread Block» استفاده میشود.

در واقع پردازنده های چند جریانی «Streaming Multiprocessor» به کار رفته در معماری های پاسکال «Pascal»، ماکسول «Maxwell» و کپلر «Kepler» از یریجستر فایل های «Register File» یک اندازه استفاده میکنند که به لطف SM های بیشتر پاسکال شاهد بهبود کلی سطح Register File های این معماری هستیم که نتیجه آن پشتیبانی بهتر بیشتر از Thread ها و Warp های است که در عملکرد نهایی نقش موثری دارد. در واقع بالا رفتن نسبت پیچیدگی «Warp ها» زمانبندی، حافظه اشتراکی و Register File در هر SM تراشه GP106 اجازه خواهد داد تا واحد های پردازشی SM با سرعت و عملکرد بیشتری کدها و دستورات پردازشی را اجرا کنند.

موتور-GPC

انویدیا در معماری پاسکال جهت افزایش استفاده و کارایی ممیز های شناور از زمانبندی پیشرفته ای همراه با برنامه ریز برتری با قابلیت همپوشانی بارگذاری/ذخیره سازی دستور العمل ها بهره برده است که موجب افزایش سرعت پاسکال «Pascal» به نسبت نسل دوم معماری ماکسول «Maxwell» شده است موتورهای GPC نیز به واسطه یک موتور میانی به نام Raster Engine بین ۵ واحد SM به اشتراک گذاشته شده اند. بنابراین پردازنده های چند جریانی «Streaming Multiprocessors» معماری پاسکال «Pascal» از چهارمین نسل موتور PolyMorph استفاده میکنند که مهمترین جز کلیدی عملیات رندرینگ پردازش های گرافیکی محسوب میشود.

حالا PolyMorph های معماری پاسکال «Pascal» از ویژگی های سخت افزاری جدیدی برای Simultaneous Multi Projection استفاده میکنند. Simultaneous Multi-Projection را میتوان یکی از جدیدترین فناوری های موجود در کارت‌های گرافیک سری GeForce GTX 1000 دانست که بیشتر بدرد افرادی میخورد که از سه مانیتور به صورت همزمان استفاده میکنند. در واقع با ترکیب فناوری جدید Simultaneous Multi-Projection میتوانیم شاهد رندرینگ به مراتب قدرتمندی برای استفاده از پیکربندی های چند مانیتوره باشیم که میتواند تفاوت بصری بسیار خوبی را به عنوان خروجی نهایی در اختیار مخاطب بگذارد.

اضافه کنیم که هر پردازنده های چند جریانی «Streaming Multiprocessors» یا SM در معماری پاسکال از هشت واحد TMUs تشکیل شده و به طورکلی از واحد SM این معماری شامل ۱۲۸ هسته کودا «CUDA» است. بنابراین GP106 از ۱,۲۸۰ هسته کودا، تعداد ۸۰ واحد TMUs و ۴۸ واحد ROPs برخوردار است. به این نکته توجه کنید که اجزای واحد SIMD معماری AMD نصف سیلیکون GP104 است واین سیلیکون از منظر عمیلیاتی و پهنای باند حافظه به کار رفته در موتور Raster Engine حدود ۷۵ درصد ضعیف تر از ویژگی های موجود در سیلیکون GP106 است.

فشرده-سازی-رنگ-در-پاسکال

کارت گرافیک GTX 1060 از ۶ گیگابایت حافظه ویدئویی GDDR5 استفاده میکند که به طور میانگین افزایش سه برابری به نسبت حافظه های GTX 960 داشته که در نسخه مرجع انویدیا با ۲ گیگابایت و در نسخه های غیر مرجع شرکای انویدیا با ۴ گیگابایت حافظه ویدئویی همراه بوده است. GeForce GTX 1060 از ۸ گیگابیت حافظه GDDR5 استفاده شده که از کلاک حافظه ۲۰۰۰ مگاهرتزی و کلاک موثر ۸۰۰۰ استفاده و یک رابط حافظه ۱۹۲ بیتی استفاده میکند که در حالت تئوری پهنای باندی معادل ۱۹۲ گیگابایت بر ثانیه را در اختیار کارت قرار میدهد.

در واقع انویدیا در معماری پاسکال «Pascal» از طریق گسترش و بهینه سازی واحد های SM به نسبت نسل دوم معماری ماکسول «Maxwell» عملکرد کلی را افزایش داده است. بدین معنا که انویدیا با تغییراتی که در واحد های SM موجود در تراشه های گرافیکی معماری پاسکال «Pascal» ایجاد کرده  موفق شده بهینه سازی بهتری به نسبت معماری ماکسول «Maxwell» در زمینه مصرف انرژی فراهم کند.

البته موارد و توضیحات فوق مدیون استفاده از لیتوگرافی ۱۶ نانومتری Fin-FET است توسط شرکت تایوانی TSMC توسعه پیدا کرده و میتواند از دستورات پردازشی Single-Precision FP32 با ۲۵۶ فایل ریجستر «Register File»، مقدار ۹۶ کیلوبایت حافظه مشترک و ۴۸ کیلوبایت کَش بافت «Texture Cache» نوع L1 پشتبانی کند که با یک خوشه پردازش بافت  «TPC» و یک موتور PolyMorph در ارتباط است. سیلیکون GP106 از نظر طراحی بسیار شبیه سیلیکون نسل قبلی GM206 است و در واقع بر اساس شالوده اصلی تراشه قبلی بنا شده است.

پهنای-باند-GTX-1060-و-GTX-960

فرکانس پایه کارت گرافیک GTX 1060 روی ۱۵۰۶ مگاهرتز تنظیم شده که این مقدار برای سیلیکون GM206 روی ۱۱۲۶ مگاهرتز تنظیم شده که به کمک قابلیت بوست «Turbo Boost» میتواند تا ۱۷۰۹ مگاهرتز افزایش یابد و با اندکی اورکلاک تا ۲۰۰۰ هم قابل افزایش است. GTX 1060 همچون برادر کوچکش یعنی GTX 960 از حافظه های GGDR5 استفاده میکندکه حدود ۸۰ گیگابایت پهنیا باند بیشتر از GTX 960 را برای کاربر فراهم میکند.

از طرفی فناوری فشرده سازی رنگ های دلتا «Delta Color» در معماری پاسکال «Pascal» با بهبود بسیار خوبی به نسبت نسل دوم معماری ماکسول داشته که در بدترین حالت ممکن باید با پهنای باند موثری معادل ۲۳۰.۴ گیگابایت بر ثانیه مواجه شویم که اینمقدار حدود ۲۰ درصد بیشتر از مقدار عادی ۱۹۲ گیگابایتی است. پاسکال از محاسبات ناهمزمان «Asynchronous Compute» هم پشتیبانی میکند که میتوانید شرح و تفصیلش را در دو مقاله «تحلیل | دعوای انویدیا و AMD در Ashes of the Singularity با DX12» و «بررسی Ashes of the Singularity و ماجرای DX12» بخوانید و لذت ببرید!

معماری Pascal تعدادی تغییرات در بخش Asynchronous Compute یا پردازش های ناهمگام نیز با خود داشته است که از دلایل اصلی چنین تغییراتی می توان به مبحث واقعیت مجازی (VR)، رابط برنامه نویسی DirectX 12 و برتری معماری کمپانی رقیب (AMD) در این بخش اشاره کرد، انویدیا در Maxwell از شیوه تفکیک یا تقسیم کردن ایستا (Static Partitioning) جهت تطبیق پردازش گرافیکی اشتراکی با پردازش های محاسباتی یا به اصطلاح Compute محور استفاده کرده است.

در حالت تئوری تا زمانیکه هر دو بخش پردازشگر گرافیکی و محاسباتی فعال باشند این گزینه روش مناسبی برای به حداکثر رساندن میزان استفاده از منابع پردازشی تراشه گرافیکی (GPU) است، اما اگر به فرض مثال در تراشه های گرافیکی بهینه شده برای مبحث گیمینگ که بخش زیادی از منابع پردازشی جهت پوشش پردازش های گرافیکی اختصاص داده شده در صف انتظار برای اتمام بخش پردازشی دیگر (Compute) باشد قسمت اعظمی از عملکرد کلی به هدر خواهد رفت.

در معماری پاسکال انویدیا با استفاده از ویژگی جدید Dynamic Load Balancing این امکان را فراهم کرده است تا منابع پردازشی تراشه گرافیکی در صورت نیاز در اولویت بندی مناسبی قرار گیرند و انجام دستورات پردازشی به طور پویا و داینامیک ادامه یابند این اولویت بندی پردازشی توسط درایور کارت گرافیکی انجام خواهد پذیرفت. علاوه بر آن انویدیا با تقویت مبحث Preemption نیز اهداف بلند مدتی در پیشرفت در بخش پردازش های ناهمگام داشته است.

Preemption در واقع توانایی جهت قطع کار یا وظیفه به منظور آدرس دهی حجم کار هایی با حساسیت زمانبندی بالا می باشد که کاهش زمان تاخیر نقش کلیدی را در این فرآیند ایفا می کند. در مقالات بعدی به بررسی فناوری های جدید به کار رفته در سیلیکون کارت های گرافیک سری gTX 1000 میپردازیم و همچنین دیگر تراشه های گرافیکی را مورد بررسی قرار میدهیم تا با ماهیت آنها آشنا شویم.

راي شما
1 Star2 Stars3 Stars4 Stars5 Stars6 Stars7 Stars8 Stars9 Stars10 Stars
Loading...

نوشته شده در AMD/ATI,بررسی سخت افزار,کارت گرافیک

آخرین نقد و بررسی ها
بررسی کارت گرافیک Gigabyte GTX 1050 Ti G1 Gaming 4 GB

بررسی کارت گرافیک Gigabyte GTX 1050 Ti G1 Gaming 4 GB

تاريخ بررسي: ۱۴ دی, ۹۵
بررسی کارت گرافیک MSI RX 480 Gaming X 8 GB

بررسی کارت گرافیک MSI RX 480 Gaming X 8 GB

۹ دی, ۹۵

9.4

بررسی کارت گرافیک ASUS ROG STRIX GTX 1060 OC 6GB

بررسی کارت گرافیک ASUS ROG STRIX GTX 1060 OC 6GB

۱۶ آذر, ۹۵

9.0

بررسی مانیتور AOC Agon AG271QG

بررسی مانیتور AOC Agon AG271QG

۵ آذر, ۹۵

9.4

بررسی کارت گرافیک Palit GTX 1080 GameRock Premium

بررسی کارت گرافیک Palit GTX 1080 GameRock Premium

۱۹ آبان, ۹۵

9.8

روزی سگی، شیری را گفت: با من ستیز کن؛ شیر سر باز زد؛ سگ گفت: نزد تمام سگان خواهم گفت شیر از مقابله با من می هراسد. شیر گفت: سرزنش سگان را خوشتر دارم تا شماتت شیران، که گویند چون شیری باشد که با سگی پنجه در پنجه شده

×
فناوری فناوری TressFX 2.0

تــیم گارد3دی

تیم گــارد3دی (Guard3d.com) سعی بر ارائه مطالب متفاوت در زمینه سخت افزار و بازی دارد و امیدوار است در این زمینه بهترین عملکرد را داشته باشد . تیم گـــارد فعالیت خود را به صورت رسمی از تاریخ 2013-10-14 برابر با 1392-07-22 آغاز کرده و تمامی مطالب تولید شده توسط این سایت برای صاحبین آن محفوظ میباشد. کپی مطالب تنها با ذکر نام (Guard3d.com) مجاز است و ما از کپی مطالب بدون ذکر دقیق لینک منبع به صفحه مطلب راضی نیستیم. امیدواریم رضایت شما را جلب کنیم .

شبکه های اجتماعی

کپی رایت 2013 © تمامی حقوق نزد Guard3d محفوظ است | طراحی و کدنویسی توسط hosseincode

error: نمیتوانید کپی کنید!!! فقط لینک صفحه برای آدرس دهی به این مطلب قابل کپی است