بررسی معماری وِگا «Vega»؛ طوفان AMD در راه است

نگاهی به معماری وِگا «Vega»؛ طوفان AMD در راه است

نگاهی به معماری وِگا «Vega»؛ طوفان AMD در راه است

نگاه اول: ریز معماری قدرتمند AMD GCN

ISA مخفف «Instruction Set Architecture» و به معنای «معماری مجموعه ای از دستور العمل ها» است که همراه با ریز معماری «Microarchitecture» دو بخش بسیار مهم پردازدن های امروزی را تشکیل میدهند. تمام سیستم های کامپیوتری بر مبنای زبان باینری (همان صفر و یک) تشکیل شده اند و به هیچ وجه نمیتوان با زبان های سطح پایینی مثل C++ و C# و … با کامپیوتر حرف زد! در واقع یک میان افزار به نام کامپایلر وجود دارد که وظیفه ترجمه زبان های مختلف به زبان باینری را به عهده گرفته که به «معماری مجموعه ای از دستور العمل ها» معروف است.

در واقع تمامی تمامی دستورالعمل‌ها، داده هایی محلی، ورودی/خروجی‌ها، ثبات‌ها، حالت آدرس‌دهی، معماری حافظه و مفسر‌ها به صورت «اسمبلی» روی سخت افزار پردازنده ها وو تراشه های مختلف نوشته میشوند که همگی آنها تحت نظر «معماری دستور العمل ها» قرار دارند. در کنار موارد فوق سیستمی وجود دارد که به ISA ها میگوید چه طوری کار کنند، چه زمانی حافظه رم را خالی یا پر کنند، چه زمانی از کش استفاده کنند و چه زمانی از ثبات و ریجسترها استفاده کنند که به این سیستم ریز معماری «Microarchitecture» گفته میشود.

بنابراین ISA زبان رابط بین سخت افزار و نرم افزار و سیستم ریز معماری هم تعیین کننده نوع ارتباطی است که تعیین میکند چه اتفاقاتی بیفتد تا با کمترین زمان ممکن به مقصد برسیم. به عبارتی؛ پردازنده های مختلف میتوانند از ISA های یکسان اما با معماری ریز پردازنده متفاوتی عرضه شوند. به طور خیلی ساده اگر بخواهیم این موارد را توضیح بدهیم، باید بگوییم که در حال حاضر، هر دو کمپانی اینتل و AMD برای تولید پردازنده های خودشان از یک دستور العمل معماری «ISA» مشخصی نام X86 استفاده میکنند و تنها تفاوت آنها در ریز معماری «Microarchitecture» آنها است که تعیین میکند کدام یک سریعتر میتواند به مقصد برسد.

ریز معماری اصلی کارتی همچون Radeon RX 480X ریز معماری GCN 0.4 است که با اسم رمز اول (منظور اسم رمز معماری) Arctic Islands برای سری RX 400 و اسامی رمز سیلیکون Vega 10/11 عرضه شده است. اولین نسل ریز معماری GCN با فناوری ۲۸ نانومتری و اسم رمز «Southern Islands» برای کارت های سری HD 7000/Rx 200 عرضه شده و مهمترین ویژگی اش استفاده از اسلات PCI-E 3.0 و فناوری AMD ZeroCore بود. پس از آن نوبت ریز معماری GCN 0.2 بود که با اسم رمز «Sea Islands» در کارت های سری HD 77900 و Radeon HD 8770, R7 260/260X, R9 290/290X, R9 295X22 خودنمایی کند.

APU های (پردازنده های دارای تراشه گرفیک مجتمع) این سری نیز با اسم رمز کاوِری «Kaveri»؛ مولینس «Mullins»؛ بیما «Beema» و پوما «Puma» برای پلتفرم موبایل و دسکتاپ معرفی شدند که از فناوری های پیشرفته ای همچون AMD TrueAudio و AMD PowerTune استفاده میکردند. مهمترین تراشه های این نسل نیز با اسم رمز هاوایی «Hawaii» معرفی شدند که در کارت گرافیک Radeon R9 290X و هم خانواده هایش مورد استفاده قرار گرفتند.

البته اسامی رمز و کاربردهای ریز معماری GCN 0.2 به همین جا ختمم نشد و با معرفی دو تراشه لیورپول «Liverpool» و دورناگو «Durango»، شاهد ورود AMD به کنسول های PS4 و Xbox One بودیم که در مقالات متعددی به آن پرداختیم. اما سومین نسل ریز از معماری GCN در سال ۲۰۱۴ با نام GCN 0.3 و همراه با دو کارت پیشواز R9 285 و R9 M295X و با اسم رمز سیلیکون تونگا «Tonga» معرفی شدند. کارت های میان رده و معمولی این سری با اسم رمز تونگا «Tonga» و کارت های رده بالای این سری هم با اسم رمز فیجی «Fiji» عرضه شدند که از مهمترین ویژگی های این نسل میتوان به پشتیبانی از نسل اول حافظه ویدئویی HBM اشاره کرد.

همچنین APU های این سری هم با نام کاریزو «Carrizo» معرفی شدند که از قابلیت های بسیار خوبی به نسبت رقیب استفاده میکردند. نسل سوم با اسم رمز «Volcanic Islands» معرفی شد و در کارت های R9 285X و Fury/Nano مورد استفاده قرار گرفت. در نهایت به چهارمین نسل ریز معماری GCN یا همان GCN 0.4 میرسیم که از قرار معلوم با اسم رمز ریز معماری «Arctic Islands» برای کارت های سری سری RX 400 و با اسم رمز سیلیکون Vega 10/11 برای کارت های جدید معرفی شده است.

خانواده کارت های Arcticc Islands در سه ماهه دوم ۲۰۱۶ و با معرفی سری AMD Radeon RX 400 عرضه شدند و تمامی نسخه های دسکتاپ آنها نیز بر مبنای اسم رمز پولاریس «Polaris» و با فناوری ۱۴ نانومتری FinFETT عرضه شدند.

نگاه دوم: معماری کاملاً جدید گرافیکی وِگا «Vega»

حالا پس از پولاریس «Polaris» نوبت به عرضه اندام ریز معماری جدیدی با اسم رمز وِگا «Vega» است که در «نقشه راه تراشه های گرافیکی AMD تا سال ۲۰۱۹» بخشی هایی از آن را بررسی کردیم. طبق چیزی که در نقشه راه AMD دیدم، معماری وِگا «Vega» از دو برابر کارایی و عملکرد بهتر به نسبت معماری  پولاریس «Polaris» بهره مند میبرد. وِگا «Vega» نام ستاره ای است که از خورشید سیاره ما ۲۵ سال فاصله نوری دارد و در جوامع علمی، پس از خورشید به عنوان دومین ستاره منظومه شمسی معروف شده است.

داده های بدست آمده از این ستاره در طول قرن های متمادی به اکتشافت بزرگی در زمینه اجرام سماوی (اختر فیزیک ها) انجامیده است. وِگا «Vega» از جایگاه مهمی بین فرهنگ ها و اساطیر مختلف برخوردار است. تراشه های وِگا «Vega» را میتوانیم مهمترین طراحی سیلیکون کمپانی AMD پس از  پردازنده های AMD Zen محسوب کنیم که به زودی مقاله جداگانه ای در موردش منتشر میکنیم. بنابراین، وِگا «Vega» یک اسم فانتزی برای معرفی نسل جدید تراشه های گرافیکی AMD محسوب نمیشود و خودش حاوی پیام مهمی است که در ادامه در موردش توضیح میدهیم.

تراشه های وِگا «Vega» بر اساس ریز معماری GCN 0.5 (مخفف Graphics CoreNext) توسعه پیدا کرده اند و به عنوان پنجمین نسل از معماری GCN راه درازی و مهمی را پشت سر گذاشته اند تا به تکامل برسند. این تراشه در واقع یک Number-Crunching (کامپیوترهایی که از توانایی محاسباتی بسیار زیادی بر پایه اعداد برخوردارند) بسیار مهم و با طراحی کاملاً جدید است که میتواند روند رو به رو شد AMD را تکمیل کند. همانطور که گفتیم؛ تراشه وِگا «Vega» بر پایه ریز معماری GCN تولید میشود، ولی از اجزای کاملاً متفاوتی استفاده میکند که تا به حال در هیچ یک از تراشه های گرافیکی قبلی AMD دیده نشده است.

این اجزا میتوانند میزان بهروه وری معماری وِگا «Vega» را برای پردازش گرافیک سه بعدی پیچیده و به طور کلی حجم پردازشی بالا آماده کنند. ایده ساخت وِگا «Vega»، به طور کلی همان روش مرسومی است که برای طراحی و ساخت دیگر تراشه های گرافیکی استفاده میشود. صنعت گرافیک کامپیوتری به سرعت در حال پیشرفت است و با ظهور رزولوشن های ۲K و ۴K، شاهد جهشی عظیم در پردازش گرافیک کامپیوتری بودیم که مدت ها بود به صورت یک آب راکد در رزولوشن ۱۰۸۰p مانده بود.

معماری وِگا «Vega»

چنین تغییری نیازمند افزایش و حتی جهش سخت افزاری قدرتمندی در معماری تراشه های گرافیکی است تا بتواند پاسخگوی این صنعت باشد. بنابراین چنین حجم عظیمی از داده های کامپیوتری نیاز شدید به بهینه سازی در سیلیکون های گرافیکی را ایجاد میکند تا از نظر بهره وری با شرایط بهتری مواجه شویم. این مورد بدون در نظر گرفتن ارائه منظم درایورهای گرافیکی در جهت بهینه سازی کارت های گرافیکی است و بدین معناست که برای این جهش و حجم انبوه پردازش گرافیکی در رزولوشن های ۲K و ۴K نیاز به جهش سخت افزاری و افزایش سطح بهره وری در سطح سخت افزار داریم نه نرم افزار!

تراشه وِگا «Vega» برای رندر صحیح تصاویر سه بعدی واقعی نیاز به گسترش قدرت پردازش هندسی دارد. در واقع برای کار با مقادیر عظیمی از محاسبات ریاضی، تراشه گرافیکی به طراحی واحدهای محاسبه «Compute Unit» جدیدی نیاز دارد تا بتواند عملکرد بالایی ار از خودش به نمایش بگذارد. همچنین موتور پیکسل تراشه هم باید برزو شود تا بتواند صحنه سه بعدی را ترسیم کند. AMD مدعی تمام این تغییرات را در معماری وِگا «Vega» به کار گرفته!

صفحه بندی

صفحه اول: ریز معماری قدرتمند GCN و معماری وِگا «Vega»

صفحه دوم: بهبود مدیریت حافظه در معماری گرافیکی وِگا «Vega»

صفحه سوم: هندسه نسل جدید، واحد های محاسباتی و موتور پیکسل جدید

صفحه چهارم: تحلیل و بررسی معماری وِگا «Vega» از نگاه گارد۳دی «Guard3d»

نگاه سوم: بهبود مدیریت حافظه در معماری گرافیکی وِگا «Vega»

بلوک دیاگرام زیر نشان میدهد تصویری فعلی با چیزی که قبلاً از معماری وِگا «Vega» منتشر شده بود متفاوت است. در واقع این تصویر نه تنها یک ویفر بلوک دیاگرام «Die Block Diagram» محسوب نمیشود، بلکه به ماژول چند تراشه ای «Multi-Chip Module» هم شباهتی ندارد و با دقت در آن متوجه میشوید که با یک معماری حافظه کاملاً بروز شده طرفیم. معماری جدیدی که باعث حرکت نرم و روان دیتاها به داخل و خارج تراشه گرافیکی میشود «GPU» تا مطمئن شویم هدر نمیرود.

تراشه های گرافیکی AMD به طور سنتی از مقادیر بزرگی از حافظه ویدئویی همراه با پهنای باند گذرگاه حافظه سطح بالا استفاده میکنند و با این حال AMD احساس میکند هنوز هم برای بهبود پهنای باند حافظه ویدئویی راه های بهتری وجود دارد. AMD معتقد است بین حافظه تخصیص یافته و دسترسی به حافظه واقعی در برنامه های کاربردی «App» توازن مناسبی وجود ندارد که منجر به از دست رفتن منابع حافظه میشود.

در این روش یک برنامه کاربردی «App» ممکن استکه  برای رندرینگ سه بعدی محتوای خودش، به بارگذاری محتوا در حافظه ویدئویی نیاز پیدا کند، اما به تمام تصاویر و محتوای مربوطه در یک زمان واحد دسترسی ندارد، بلکه فقط بخشی از آن در دسترس قرار میگیرد و موجب اتلاف منابع حافظه میشود. همین اختلاف جزئی میتواند موجب تحلیل رفتن بخشی از قدرت حافظه شود و به زور پهنای باند گذرگاه حافظه اشغال شود که نتیجه آن افزایش و تکرار بی مورد هر سیکل کلاک تراشه برای انتقال داده ها خواهد شد.

توسعه دهندگان درایور گرافیکی به طور معمول با بازیسازان در ارتباط هستند و برای به حداقل رساندن این پدیده، بروز رسانی هایی تحت عنوان «Patches» و درایورهای مختلف را برای بازی مورد نظر منتشر میکنند تا اتلاف حافظه به حداقل ممکن کاهش یابد. حالا AMD قصد دارد با طراحی جدیدش، چیزی شبیه این مورد را به صورت سخت افزاری درون تراشه های گرافیکی موسوم به وِگا «Vega» قرار دهد. AMD اسم این روش جدید را «Adaptive Fine-Grained Data Movement» نام گذاری کرده که برگردان فارسی مشکلی دارد و بهتر است به همین نام خوانده شود!

دیاگرام کش با پهنای باند سطح بالا

برای استفاده از این فناوری جدید از یک پایپ لاین «Pipeline» جدید استفاده شده تا منابع بهتری به تراشه گرافیکی تخصیص داده شود. رفع مشکل اتلاف منابع در حافظه ویدئویی به طراحی کاملاً جدیدی نایز داشت که پیش زمینه آن وجود سخت افزارهای جدیدی که در تراشه های امروز دیده نمیشود. به همین دلیل از حافظه کش بسیار پر سرعت و جدیدی در این معماری استفاده شده که یک لایه بالاتر از حافظه کش سطح دوم سنتی قرار میگیرد که هم بزرگ و پر سرعت است و هم از تاخیر بسیار بسیار کمی برخوردار است.

این کش یک در واقع قطعه سیلیکون جداگانه ای است که در لایه Interposer نشسته است. Interposer برای اولین بار در طراحی معماری کارت گرافیک Radeon R9 Fury X دیده شد. این لایه سیلیکونی توسط UMC و با لیتوگرافی ۶۵ نانومتری طراحی شده و از نسل دوم حافظه HBM ساخت کمپانی SK Hynix بر روی یک گره ۲۰ نانومتری استفاده میکند. Interposer در واقع یک روش سیم کشی جدید برای حذف مشکلات ناشی از حافظه های GDDR5 بود که حالا به عنوان یک جایگزین برای ارتباط حافظه های انباشته HBM با بستر تراشه مورد استفاده قرار میگیرد.

سیستم کنترلر کش با پهنای باند سطح بالا

با GPU ادغام شده و به صورت انباشته در آمده تا هم فضای کمتری اشغال کند و هم مصرف برق کمتری داشته باشد که نتیجه آن کاهش محسوس ابعاد ویفر «Die» تراشه گرافیکی است. یعنی همان اتفاقی که در Radeon R9 Fury X شاهدش بودیم! روش ذخیره سازی اطلاعات مختلف در این بستر به جای مدل سیم کشی قبلی حافظه های GDDR5 به صورت شبکه گسترده ای از سیم یا برآمدگی های میکروسکوپی «Microscopic Wires» است که بین حافظه انباشته HBM و بستر تراشه گرافیکی قرار گرفته و ارتباط حافظه HBM با تراشه گرفیکی را ممکن میسازد.

در واقع لایه Interposer بر روی یک سیلیکون ۶۵ نانومتری ساخته شده و در مقایسه با سیم کشی فایبرگلاس PCB بسیار ریز و کوچک است. این روش برای اولین بار توسط AMD ابداع شده است. به هر حال؛ تمام تغییرات صورت گرفته برای حرکت به سمت نسل دوم حافظه HBM بوده و بخش جدیدی که به معماری وِگا «Vega» اضافه شده، HBMC نام گذاری شده است. HBMC به عنوان یک بخش مستقل و مجزا به تمامی حافظه های موجود دسترسی دارد و از یک فضای مجازی اختصاصی ۵۱۲ ترابایتی برخوردار است.

در این روش، تراشه گرافیکی از HBMC برای بهبود تبادل داده های بین پردازنده و تراشه گرافیکی مورد استفاده قرار گرفته تا در زمان واکشی اطلاعات از دیگر بخش های سیستم به سمت حافظه ویدئویی، اتلاف کمتری صورت بگیرد تا میزان بهره وری و راندمان کلی سیستم افزایش یابد. در حالت تئوری، تراشه های مبتنی بر معماری وِگا «Vega» میتوانند از حداکثر ۳۲ گیگابایت حافظه HBM2 استفاده کنند.

نگاه چهارم: هندسه نسل جدید، واحد های محاسباتی و موتور پیکسل جدید

در معماری وِگا «Vega» پردازش هندسی به نسبت نسل گذشته بهبود یافته و نسل جدید هندسه قابل برنامه ریزی پایپ لاین «Pipeline» ها بیش از دو برابر خروجی هر سیکل کلاک توان عملیاتی دارد. معماری وِگا «Vega» حالا علاوه بر Vertex ها از شیدرهار ابتدایی «Primitive Shaders» و هندسی «Geometry Shaders» (یک نوع سیستم سایه زنی بسیار پیشرفته) هم پشتیبانی میکند. AMD در معماری وِگا «Vega» حجم کارهای پردازشی را بین واحدهای هندسی، واحدهای محاسبه گر و موتور پیکسلی «Pixel Engines» توزیع کرده تا بهره وری بیشتری حاصل شود.

از طرفی  میتوانیم به شیدرهای ابتدایی «Primitive Shaders» اشاره کنیم که نوع جدیدی از سیستم سایه زنی سطح پایین محسوب میشوند که توسعه دهنده بازی توسط آن میتواند مراحل سایه زنی مورد نظرش را مشخص کند و در واقع با این روش آزادی و اختیار عمل بیشتری برای مدیریت Primitive Shaders بدست می آرود.  این روش جدید به عنوان یک نوع روش سایه زنی یا همان «Primitive Shaders» در نرخ بالاتری اجرا میشود و به صورت یک سیستم مجزا و مستقل از روش سایه زنی سنتی مبتنی بر دایرکت ایکس «DirectX Shader Pipeline» عمل میکند.

نسل بعدی واحدهای محسابه گر «Next-Generation Compute Units»

تمام توسعه دهندگان به صورت طبیعی بهینه سازی های لازم را روی بازی مورد نظر انجام میدهند و این مورد پس از عرضه بازی های مختلف نیز به چشم میخورد. با این حال؛ کمپانی AMD هم میتواند از درایورهای اختصاصی خودش به صورت پیش فرض استفاده کند تا بازی مورد نظر با کیفیت مطلوب تری اجرا شود. در این حالت؛ تعدادهای از DirectX shaders ها با برای افزایش بهبود  عملکرد سیستم با شیدرهار ابتدایی «Primitive Shaders» جایگزین میشوند.

مهمترین بخش این معماری، واحدهای محسابه گر «Compute Unit» آن است که برای Number-Crunching (کامپیوترهایی که از توانایی محاسباتی بسیار زیادی بر پایه اعداد برخوردارند) موازی طراحی شده است. AMD با معماری وِگا «Vega» قابلیت CU ها را آنقدر بهبود بخشیده که از آنها به عنوان «NCUs» یا نسل بعدی واحدهای محسابه گر «Next-Generation Compute Units» یاد میکند. این واحدهای جدید حالا از Super-Simple های ۸ بیتی و  به علاوه ۱۶ بیتی که در معماری پولاریس «Polaris» معرفی شده پشتیبانی میکنند.

«NCUs» یا نسل بعدی واحدهای محسابه گر «Next-Generation Compute Units»

همچنین پشتیبانی از عملیات ممیز شناور «Floating point» در دو حالت دقت ساده «Single-Precision» و دقت مضاعف «Double-Precision» هم به آن افزوده شده که در معماری های پیشین AMD به صورت کامل حضور نداشتند. عملیات ممیز شناور «Floating point» برای کدبندی محل ممیز، فشار پردازشی بسیار سنگینی به تراشه گرافیکی وارد میکند و اگر قرار باشد اعداد در فضایی برابر با ممیز ثابت ذخیره شوند، ممیزهای شناور دامنهٔ بیشتری را به بهای دقت کمتر پشتیبانی خواهند کرد.

سرعت عملیات ممیز شناور که معمولاً با عنوان اندازه‌گیرهای کارایی فلاپس شناخته می‌شود، در نرم‌افزارهایی که بر مبتنی بر عملیات ریاضی هستند کاربرد فراوانی دارد. هر دو حالت دو حالت دقت ساده «Single-Precision» و دقت مضاعف «Double-Precision» بر پایه استاندارد IEEE 754 کار میکنند. این بدین معنا است که عملیات ممیز شناور نوع دقت ساده «Single-Precision» از یک رقم طولی ۳۲ بیتی استفاده میکنند که ۸ بیت آن برای نما، ۲۳ بیت برای بخش کسر و ۱ بیت آن هم برای علامت های مختلف مورد استفاده قرار میگیرد.

پهنای باند دو برابری HBM2

اما همین مقایدر برای حالت دقت مضاعف به ۱۱ بیت برای نما، ۵۲ بیت برای بخش کسر و ۱ بیت برای علامت های مختلف افزایش پیدا میکند. حالا در معماری وِگا «Vega» هر دو این حالت ها را به بهینه سازی های بیشتری تحت عنوان «NCUs» در کنار هم داریم که قطعاً میتواند میزان عملکرد و بهره وری تراشه را افزایش دهد. پشتیبانی از Super-Simple های ۸ بیتی هم به توسعه دهنده بازی اجازه میدهد کدهای خودش را ساده تر طراحی کند، بنابراین اگر آن را در یک فضای آدرس دهی ۸ بیتی قرار دهیم، ۵۱۲ ترابایت آنها میتوانند در هر سیکل کلاک پردازش شوند.

این ۵۱۲ ترابایت فضای مجازی برای آدرسی دهی مجازی خودش مهر تاییدی است بر اینکه معماری وِگا «Vega» از حافظه های نسل جدید HBM2 استفاده میکند و این موضوع شامل تمامی کارت های این سری میشود. همچنین پهنای باند دو برابری که به آن اشاره کردیم، نشان دهنده افزایش تعداد پین های HBM2 است و این مورد در کنار افزایش حافظه کش داخلی که به صورت اختصاصی مورد استفاده قرار گرفته، میتواند بیش از ۲ برابر عملکرد بهتر به نسبت معماری های پیشین را برای AMD به همراه داشته باشد.

۵۱۲ ترابایت فضای مجازی برای آدرسی دهی مجازی

در این معماری، کمپانی AMD از ویژگی جدید دیگری به نام  بسته بندی سریع ریاضی! «Rapid Packed Math» رونمایی کرده که برای ثبت کارهای سبک بین ۱۶ تا ۳۲ بیتی استفاده میشود. همچنین فناوری نسل جدید Vega NCU میتواند تا ۴ برابر نسل قبل خودش در هر سیکل کلاک از پردازش بهینه تری استفاده کند و این کار با سرعت کلاکی دو برابر بیشتر از معماری های پیشین انجام میشود. از طرفی همچون معماری های انویدیا، در معماری وِگا «Vega» نیز با یک الگوریتم فشرده سازی پهنای باند حافظه طرفیم که میتواند پهنای باند موثر حافظه ویدئویی را بهبود بخشد.

از طرفی موتور پیکسلی «Pixel-Engine» نیز با نسل جدیدی از Draw-Stream Binning Rasterizer ها بهبود یافته که باعث صرفه جویی در هر سیکل ساعت میشود و به حافظه کش و داخلی و حافظه ویدئویی کمک میکند تا بتواند بهره وری بهتری ایجاد کند. معماری وِگا «Vega» نشان داده که AMD سلسله مراتب یا همان رده بندی تراشه های گرافیکی خودش را برای بهبود و دریافت افزایش عملکرد چشمگیر در برنامه های کاربردی و بازی های مختلف تغییر داده تا بلکه بتواند قدم رو به جلویی در صنعت گرافیک کامپیوتری برداشته باشد.

۸ برابر ظرفیت بیشتر در حافظه HBM2

البته AMD پیش از این هم در موارد بسیاری پیش رو بوده، اما در آخر بازی را به غول ثروتمندی همچون انویدیا باخته است! خط لوله های هندسی «Geometry Pipeline»، موتورهای محسابه گر «Compute Engine» و موتور پیکسلی «Pixel Engine» در حال حاضر از حافظه کش سطح دوم «L2» استفاده میکنند. پیش از این موتورهای بافت زنی و پیکسلی به صورت مستقیم با حافظه در ارتباط نبودند و همین مورد مشکلات مختلفی برای معماری های پیشین ایجاد کرده بود که حالا رفع شده است.

نگاه پنجم: تحلیل و بررسی معماری وِگا «Vega» از نگاه گارد۳دی «Guard3d»

منابع موجود در وب سایت WCCFTech اعلام کردند AMD قصد دارد کارت های گرافیک مبتنی بر معماری وِگا «Vega» را در اواسطه ماه May (اردیبهشت ماه) روانه بازار کنند. این خبر تایید شده و شامل کارت های رده بالا و پرچمدار معماری وِگا «Vega» میشود که از حافظه های نسل جدید HBM2 استفاده میکنند. گزارشات مختلف نشان میدهد کارت های جدید به طور رسمی از دو سیلیکون Vega 10 (برای تراشه های گرافیکی رده بالا) و سیلیکون Vega 11 (برای تراشه های رده پایین، با مصرف برق کمتر از پولاریس «Polaris 10» و عملکردی بهتر از آن) استفاده میکنند.

از طرفی این احتمال که کارت های جدید از دو سیلیکون Vega 10 به طورهمزمان استفاده کنند وجود دارد. این موضوع در خبرگذاری های خارجی به صورت VEGA 10 x2 ذکر شده که لزوماً معنای استفاده از دو تراشه گرافیکی «Dual GPU» روی یک ویفر «PCB» نیست. در واقع پسوند x2 نشانگر استفاده از همان معماری بدون تغییر VEGA 10 با دو برابر حافظه ویدئویی بیشتر است. این گزارشات نشان میدهند که احتمالاً AMD با این سیلیکون تقویبت شده به دنبال رقابت شانه به شانه با سیلیکون های قدرتمند GP104 و GP102 انویدیا است که البته کمی دور از ذهن به نظر میرسد.

Vega 10 به عنوان یک تراشه Full Chip  ممکن است در کنسول های بازی نسل جدید هم مورد ساتفاده قرار بگیرد. در همین رابطه شایعه یا خبر دیگری که در سطح وب منتشر شده، امکان استفاده از Vega 11 به عنوان یک تراشه Cut Chip در کنسول جدید مایکروسافت یعنی Xbox Scorpio است که به خودی خودش اهمیت این موضوع را نشان میدهد. این موضوع را میتوانید در مقاله «نگاهی به کنسول جدید Xbox One Scorpio» پیگیری کنید.

ویژگی جدید بسته بندی سریع ریاضی «Rapid Packed Math»

Vega 10 از ۴۰۹۶ عدد پردازنده جریانی استفاده میکند که با سرعت ۲۴ ترافلاپ بر ثانیه میتواند پهنای باند عظیمی معادل ۵۱۲ گیگابایت بر ثانیه را با دو مدل حافظه ۸ و ۱۶ گیگابایتی HBM2 در اختیار مصرف کننده بگذارد که جهش بزرگی برای AMD است. از طرفی احتمالاً بایدش اهد عرضه سیلیکون های دیگری به نام Vega 20 باشیم که قرار است با لیتوگرافی ۲۰ نانومتری تولید شوند و از سرعت کلاک بالاتر، سرعت حافظه ۱ ترابایتی و ۳۲ گیگابایت حافظه ویدئویی HBM2 استفاده میکنند.

این سیلیکون از ۱۵۰ وات توان حرارتی استفاده میکند که در مقابل توان حرارتی ۲۲۵ واتی Vega 10 رقم فوق العاده ای محسوب میشود. Vega 10 به عنوان یکی از قویترین سیلیکون های AMD از ۶۴ واحد CU استفاده میکند و در نمایشگاه CES 2017 نیز توسط آقای راجا کودوری به نمایش گذاشته شد. اتفاق جالی که در نمایشگاه CES 2017 افتاد این بود که AMD برای نمایش قدرت پردازشی معماری جدیدش از یک سیستم حرفه ای با پردازنده های نسل جدید Ryzen در کنار کارت های گرافیک مبتنی بر معماری وِگا «Vega» استفاده کرد.

در این تست سیستم مورد نظر موفق شد بازی Star Wars Battlefront را با سطح کیفی Ultra HD و سرعت ۶۰ فریم بر ثانیه به راحتی اجرا کند. همچنین در تستی دیگر، سیستم مورد نظر بازی Ultra HD را با سرعت ۶۰ فریم بر روی رزولوشن ۴K اجرا میکند تا قدرت خارق العاده کارت های گرافیک مبتنی بر معماری وِگا «Vega» را به رخ بینندگان بکشد. البته این سطح کیفیت و عملکرد تنها از ترکیب کارت های وگا و پردازنده های Ryzen حاصل شده است.

معماری وِگا «Vega» به صورت خاصی برای بهبود اورکلاک و IPC بیشتر طراحی شده و علاوه بر افزایش کلاک، حالا میتوئاند از دو برابر دستورات بیشتر در هر سیکل کلاک استفاده کند. در این معماری، همچون پولاریس «Polaris» از  بخش محاسباتی سیستم سایه زنی و آدرس دهی به صورت جداگانه استفاده شده تا عملکرد و میزان بهره وری معماری وِگا «Vega» افزایش پیدا کند. همچنین سیستم مدیریت و کنترل  حافظه انقلابی HBMC در بخش کنترل کش سطح سوم اجزا دسترسی آزادانه به حافظه های اضافی همچون SSD های فوق پر سرعت را همچون میدهد تا داده های ترابایتی، مخصوصاً در صنعت سینما برای پردازش به سهولت جا به جا شوند.

سیستم پیکسل گذاری یا همان موتور پیکسلی «Pixel-Engine» جدیدیی که برای معماری وِگا «Vega»  طراحی شده از نظر جئومتری ساختمان طراحی شبیه همان چیزی است که در کارت گرافیک R9 FuryX دیده بودیم، اما در اینجا ظرفیت دو برابر شده و از دو مسیر جداگانه برای برای پردازش هم زمان جئومتری و انجام پیکسل گذاری برای ۶۴ واحد CU استفاده میشود. سیستم پیکسل گذاری جدید حالا از  Tiled یا BINning Rasterization هم پشتیبانی میکند که با توجه به دسترسی به حافظه کش سطح دوم، میتواند موجب بهبود سایه زنی و کاهش تاخیر اضافی شود که نتیجه آن کاهش مصرف پهنای باند و عمل پیکسل گذاری بیهوده است.

در معماری وِگا «Vega» توان عملیاتی جئومتری ها «Geometry» از ۴ به ۱۱ کلاک افزایش یافته که در کنار چهار موتور جئومتری «Geometry» از بهره وری بهتری در استفاده از پهنای باند موثر و مصرف انرژی کمتر برخوردار است. همچنین واحد های جدید حالا از ۱۲۸ دستورالعمل ۳۲ بیتی در هر چرخه پردازشی استفاده میکند و با توجه به افزایش فرکانس کلاک در معماری وِگا «Vega»، حالا با ظرفیت بیشتری در پردازش موثر حجم عظیمی از داده های سه بعدی هستیم.

در طرف دیگر؛ نسل دوم HBM 2 از چهار کانال به اصطلاح ساختگی یا مجازی «Pseudo» استفاده میکند که هر کدامشان قابلیت به اشتراک گذاری داده های Aword را دارند. استفاده از کانال Pseudo منجر به کاهش مصرف انرژی میشود. این مورد در کنار افزودن قابلیت پشتیبانی از اجرای دستورالعمل های پی در پی در یک چرخه واحد «Single Cycle» از جمله تغییرات بسیار مهم در معماری وِگا «Vega» است. در معماری جدید هر واحد محسابه گر «Compute Unit» یا اصطلاحاً CU از ۱۲۸ واحد محاسبه و منطق برای اجرای سریعت عملیات محاسبه و منطق و ریاضی استفاده میکند.

همچنین مسیرهای دسترسی به Compute Unit ها افزایش یافته و این مورد میتواند به خودی خودش کاهش وابستگی این معماری به حافظه گرافیکی را در پی داشته باشد. ما در معماری وِگا «Vega» با اجرای دستور العمل های متفاوتی به نسبا معماری های پیشین AMD طرفیم. بدین معنا که در معماری های پیشین GCN؛ همچون چیزی که در کارته ای سری FURY و دوسری R9 300 و R9 200 دیده بودیم، حجم اصلی کارها توسط تراشه گرافیکی «GPU» انجام  میشد و به همین دلیل از تمام واحد های SIMD به درستی استفاده نمیشد.

اما در معماری وِگا «Vega» تمامی واحد های SIMD در یک واحد محسابه گر «Compute Unit» مجتمع متمرکز شده اند و میتوانند از تمام SIMD ها به صورت یکجا استفاده کنند که در عمل موجب کاهش هدر رفت پهنای باند تراشه گرافیکی و حافظه ویدئویی میشود. تصویر شماتیک زیر نشان میدهد که اولاً SIMD ها همیشه درون واحدهای CU حضور داشتند و دوماً NCU های جدیدی معماری وِگا «Vega» در هر سیکل کلاک میتواند دستورات بیشتری را قبول کند که نتیجه آن افزایش بهره وری بیشتر به نسبت معماری های پیشین AMD است.

سیستم جدید واحد محاسبه و منطق معماری وگا که به NCU معروف شده است

مشابه همین روند در بخش حافظه ویدئویی هم پیادهن سازی شده و همانطور که گفتیم با طراحی و انقلابی جدید در این بخش طرفیم. مثلاً در معماری های پیشین، برای دسترسی آزادانه به بافت ها و پیکسل ها به حافظه حجیم تری نیاز بود و این عمل بایدبه صورت غیر منسجم «Non coherent» انجام میشد که پیش درآمدش حرکت حجم عظیمی از داده های مختلف و غیر ضروری برای رندرینگ بافت ها خارج از خط لوله ها «Pipelines» بود. این کار هم بسیار زمان بر و هم هزینه بر بود. ولی در معماری جدید، با توضیحاتی که در بالا به آن اشاره کردیم، این مشکلات بر طرف شده و حالا تمام اتفاقات مختلف به شکل بهینه تری به اتمام میرسند.

در نهایت ما باید به این نکته اشاره کنیم که معماری وِگا «Vega» تغییرا بسیار گسترده ای داشته و برای HPC ها و پردازشی ها سنگین هم محصولات مختلفی به همراه دارد.در حال حاضر گفته میشود کارت های گرافیک دسکتاپ این معماری به شرح جدول زیر است که البته هنوز به تایید نهایی نرسیده است. اما مشخص شده که HPC ها از کارت هایی مبتنی بر Vega 11 استفاده میکنند که در زمینه کاهش مصرق برق و توان حرارتی بهتر از Polaris 10 عمل میکند.

کارت های گرافیک دسکتاپ معماری وِگا «Vega»

نام کارتمعماری
RX 590Vega 11 XT
RX 580Vega 11 Pro
RX 570Polaris 10 XT
RX 560Polaris 10 Pro
RX 550Polaris 11 XT
RX 540 Polaris 11 Pro
RX 530Polaris 12
خروج از نسخه موبایل