با-دو-تراشه-گرافیکی-Tesla-P100-و-Pascal-GP100-آشنا-شوید

Tesla P100 را میتوان اولین کارت گرافیک قدرتمند Tesla مبتنی بر معماری پاسکال «Pascal» دانست که در کنفرانس سالانه فناوری های گرافیکی ۲۰۱۶ رونمایی شد. انویدیا P100 را میتوان اولین بروز رسانی عمده خانواده Tesla HPC دانست که از زمان عرضه اولین کارت های مبتنی بر معماری کپلر «Kepler» در واخر سال ۲۰۱۲ تا زمان صورت میگیرد. این به معنای افزایش عملکرد بسیار بزرگ خانواده های تسلا «Tesla» است که به لطف فرآیند ساخت ۱۶ نانومتری معماری پاسکل «Pascal» روی میدهد.

تراشه قدرتمند Tesla P100 را تا حدودی میتوان نسخه غیر فعال تراشه گرافیکی نسل جدید انویدیا GP100 دانست که به جای ۶۰ واحد از ۵۶ واحد فعال SMs استفاده میکند. البته GP100 را میتوان مثل یک نهنگ بزرگ دانست؛ تراشه قدرتمندی که از ویفری «Die» با ابعاد بزرگ ۶۱۰ میلیمتر استفاده میکند و با لیتوگرافی ۱۶ نانومتری FinFET کمپانی TSMC تایوان تولید شده و ۱۵.۳ بیلیون ترانزیستور را در خودش جای داده است که رقم حیرت انگیزی محسوب میشود.

واقعاً در نوع خودش جالب توجه است که کمپانی تایوانی TSMC در حال حضر موفق شده با فناوری لیتوگرافی ۱۶ نانومتری FinFET از چنین حجم عظیمی از ترانزیستور در یک تراشه گرافیکی استفاده کند، چون هر چیزی که تا به حال از این کمپانی دیدیم، در بهترین حال تایید شده اش، یک چهارم اندازه مساحت ویفر «Die» تراشه قدرتمند Tesla P100 بوده است. در حال حاضر برای قرار دادن تراشه گرافیکی و حافظه HBM2 روی لایه Interposer در تراشه انویدیا GP100 از فناوری چیپ-در-ویفر-در-زیر لایه «Chip-On-Wafer-On-Substrate» استفاده میشود.

آنالیز اولیه تراشه های گرافیکی نسل بعد انویدیا پاسکال

تراشه-Tesla-P100

ما به سمت معماری کامل پاسکال «Pascal» در حرکتیم و شایان ذکر است که هر SM در معماری پاسکال از هسته های کودا با قدرت پردازشی ۶۴/FP32 استفاده میکند که این مقدار در معماری ماکسول «Maxwell» معادل ۱۲۸ تا بود. به عبارتی دیگر هر کدام از SM ها «واحد های Streaming Multiprocessor» شامل هسته های ۶۴/FP32 ای هستند که هر کدامشان ۱/۲ نرخ قدرت پردازشی FP64 را برای ما فراهم میکند.این بدین معناست که پاسکال جدید میتواند از دو بسته عملیاتی محاسبات اعشاری FP16 در کنار یک هسته کودا FP32 مورد استفاده قرار بگیرد.

روی هم رفته تراشه قدرتمند Tesla P100 میتواند با یک افزایش کلاک ۱.۴۸ مگاهرتزی در حالت FP32 توان پردازشی خامی معادل ۱۰.۶ ترافلاپس «TFLOPS» و در حالت FP64 هم ۵.۳ ترافلاپس عملیات پردازشی انجام دهد. این رقم دو سه برابر بیش از توان عملیاتی خام تراشه Tesla K40 است که در ایستگاه های کاری قدرتمند مورد استفاده قرار گرفته است. Tesla P100 دلیل خوبی برای خوشحالی انویدیا است، چون پس ازمدت ها یک تراشه گرافیکی قدرتمند را روانه بازارهای تجاری میکنند.

اما بیاید به مفهوم دو عبارت FP32 و FP64 نگاهی بیندازیم. این دو کلمه مخفف Floating Point Operations Per Second و به معنی تعداد اعمال محاسبه‌ی اعشاری در ثانیه است و در حقیقت واحدی استاندارد برای بیان قدرت پردازشی است. این عبارت در فارسی معادل گیگافلاپس و به معنای (یک میلیارد عمل اعشاری در ثانیه) و ترافلاپس (یک بیلیون یا ۱۰ به توان ۱۲ عمل اعشاری در یک ثانیه) است. یعنی قدرت خام پردازش اعشاری تراشه گرافیکی یا پردازنده مرکزی.

خانواده تراشه های گرافیکی نسل تسلا «Tesla»

Tesla P100Tesla K80 Tesla K40Tesla M40
پردازنده جریانی۳۵۸۴ ۲x2496۲۸۸۰۳۰۷۲
کلاک هسته۱۳۲۸ مگاهرتز۵۶۲ مگاهرتز۷۴۵ مگاهرتز۹۴۸ مگاهرتز
بوست کلاک۱۴۸۰ مگاهرتز۸۷۵ مگاهرتز۸۱۰/۸۷۵ مگاهرتز۱۱۴ مگاهرتز
کلاک حافظه ۱.۴Gbps HBM2۵GHz GDDR5۶GHz GDDR5۶GHz GDDR5
گذرگاه حافظه۴۰۹۶ بیتدو تا ۳۸۴ بیت۳۸۴ بیت۳۸۴ بیت
پهنای باند حافظه ۷۲۰ گیگابایت بر ثانیه۲ تا ۲۴۰ گیگابایت بر ثانیه۲۸۸ گیگابایت بر ثانیه۲۸۸ گیگابایت بر ثانیه
حافظه ویدئویی۱۶ گیگابایت۲ تا ۱۲ گیگابایت۱۲ گیگابایت۱۲ گیگابایت
Half Precision۲۱.۲ ترافلاپس۸.۷۴ ترافلاپس۴.۲۹ ترافلاپس۶.۸ ترافلاپس
Single Precision۱۰.۶ ترافلاپس۸.۷۴ ترافلاپس۴.۲۹ ترافلاپس۶.۸ ترافلاپس
Double Precision۵.۳ ترافلاپس (۱/۲ ریت)۲.۹۱ ترافلاپس (۱/۳ ریت)۱.۴۳ ترافلاپس (۱/۳ ریت)۲۱۳ ترافلاپس (۱/۳۲ ریت)
هسته گرافیکی GP100GK210GK110BGM200
تعداد ترانزیستورها ۱۵.۳ بیلیون۲ تا ۷.۱ بیلیون۷.۱ بیلیون۸ بیلیون
توان مصرفی ۳۰۰ وات۳۰۰ وات۲۳۵ وات۲۵۰ وات
خنک کنندهمشخص نیستPassiveActive/Passive Passive
لیتوگرافیTSMC 16nm FinFETTSMC 28nmTSMC 28nmTSMC 28nm
معماری پاسکال «Pascal» کپلر «Kepler»کپلر «Kepler»نسل دوم معماری ماکسول

از FP32 برای پردازش های بدون دقت استفاده میشود و در مقابل از FP64 یا دقت مضاعف یا دو برابر یا double precision (برای هر عدد ۶۴ بیت) برای پردازش های با دقت بالا استفاده میشود. بنابراین محاسبه‌ی اعشاری می‌تواند به صورت ۳۲ بیتی یا ۶۴ بیتی باشد و البته یک مدل ۱۶ بیتی هم برای گوشی‌ها وجود دارد که برای کاربردهای سبک تر مورد استفاده قرار میگیرد. اما شاید سوال کنید تراشه گرافیکی نسل جدید انویدیا GP100 که از هر دو حالت ۶۴/FP32 استفاده میکند به چه معنا است!؟

بگذارید این مورد را با یک مثال روش کنیم؛ کاربرد FP64 برای پردازش های بسیار دقیق است. تراشه های گرافیکی که در حال حاضر در سیستم های ما استفاده میشود از نوع پردازش محاسبات اعشاری ۳۲ بیتی «FP32» استفاده میکند. بدین معنا که در یک بازی باید موقعیت دقیق اجسام، پرتوهای نور و سایه ها، برخورد اجسام و محاسبات فیزیکی، شبیه‌سازی بسیار دقیق جریان مایعات، سطح آب و حرکات مو و … را یکی یکی انجام دهد و نتیجه را به صورت یک تصویر واحد رندر شده به خروجی کارت گرافیک بفرستد تا شما آن را به صورت یک تصویر نهایی مشاهده کنید!

اما در نوع پردازش محاسبات اعشاری ۶۴ بیتی «FP64» کافی است تخمینی از تمام موارد لحاظ شود و در نهایت تصویر نهایی ساخته شود. این همان چیزی است که ما در انویدیا GP100 و Tesla P100 با آن رو به رو هستیم! یعنی استفاده از هر دو نوع پردازش محاسبات اعشاری ۳۲ و ۶۴ بیتی در کنار هم! از مهمترین کاربردهای پردازش ۶۴ بیتی میتوان به محسابه دقیق Ray Tracing یا محاسبه‌ی مسیر پرتوی نور اشاره کرد که تا پیش از این فقط توسط کارت های قدرتمند «کوآدرو انویدیا» و یا توسط «فایرپروهای ای‌ام‌دی» صورت میگرفت.

بررسی ابتدایی معماری ترشه گرافیکی پاسکال

بلوک-دیاگرام-GP100

اما حالا میشود تمام این موارد را فقط با یک کارت قدرتمند مبتنی بر معماری انویدیا GP100 تجربه کرد! محسابه دقیق Ray Tracing فقط بخشی از نیاز محاسبات اعشاری ۶۴ بیتی «FP64» است که در معماری پاسکال انویدیا GP100 به صورت ساده تری در دسترس است. در کنار این مورد میتوان به شبیه سازی چهره، شبیه‌سازی فیزیکی و دینامیکی ذرات و شبیه سازی بسیاری از موارد موجود در بازی های مختلف اشاره کرد که برای رندر نهایی به یک کارت قدرتمند در محاسبات FP64 نیاز دارند که حالا کارت های پاسکال انویدیا GP100 و Tesla P100 این مورد را فراهم کرده اند.

هر دو جفت از تراشه های گرافیکی انویدیا GP100 و Tesla P100 از ۱۶ گیگابایت حافظه ویدئویی «VRAM» نسل جدید HBM2 استفاده میکنند که هر کدامشان به ۴ پُشته ۴ گیگابایتی تقسیم شده اند و روی یکدیگر قرار گرفته اند تا در مجموع ۱۶ گیگابایت حافظه تشکیل شود. به گفته انویدیا؛ تراشه P100 میتواند ۷۲۰ گیگابایت پهنای باند حافظه را ارائه دهد که میتواند یک کلاک حافظه ۱.۴ گیگاهرتزی را برای هر ماژول حافظه ویدئویی همراه داشته باشد.

این مقدار پهنای باند حافظه در مقابل دیگر محصولات تولید شده با HBM افزایش قابل توجهی در پهنای باند حافظه را نشان میدهد که بیش از دو برابر نسل گذشته است. علاوه بر مواردی که در بالا اشاره کردیم، انویدیا اعلام کرده که در تراشه های گرافیکی نسل جدید مبتنی بر معماری پاسکال از گذرگاه جدید NVLink استفاده کرده که این مورد شامل هر دو تراشه انویدیا GP100 و Tesla P100 میشود وهر کدام از این دو از ۴ کنترلر NVLink استفاده میکنند.

بررسی پایه معماری ماکسول (Maxwell)

کانکتور-NVLink

انویدیا قبلاً اعلام کرده بود که گذرگاه نسل جدید NVLink اجازه اتصال تراشه ها به یکدیگر را میدهد و میتواند از پردازنده های «OpenPOWER» هم پشتیبانی کند. این گذرگاه میتواند پهنای باندی بسیار فراتر از PCIe 3 فعلی را برای کاربران به همراه داشته باشد. این گذرگاه به چند دلیل برای انویدیا اهمیت زیادی دارد که یکی از مهمترین آنها را میتوان یکپارچه سازی حافظه ها نامید. Tesla P100 و GP100 را میتوان بهترین و قویترین تراشه های گرافیکی HPC ها دانست.

HPC مخفف واژه High performance computer است و به کامپیوترهایی گفته میشود که دارای سیتم عامل ویژه ماکروسافتی ویا اغلب لینوکسی هستند از چندین هزار پردازنده تشکیل شده اند که به طور همزمان عملیات پردازش را انجام می دهند. هر دو تراشه گرافیکی جدید پاسکل از HPC های گذشته ای که از Tesla K20/40/80 استفاده میکردند پشتیبانی میکنند و از ویژگی هایی همچون محاظ حافظه ECC برای ثبت فایل ها، کش و حافظه HBM2 استفاده میکنند.

هچنین نرخ FP64 و جانشینی تراشه های GK110/GK210 را هم باید به این لیست بیفزاییم تا دید بهتری نسبت به تراشه های پاسکال انویدیا GP100 و Tesla P100 بدست آوریم. تصاویر جدیدی که انویدیا منتشر کرده نشان میدهد این تراشه از کانکتور mezzanine در کنار یه PCB تخت و کوتاه استفاده میکند. بدین معنا که با یک طراحی کاملاً HPC محور مواجه ایم. در واقع هنوز از روش نصب کارت های مبتنی بر معماری پاسکال اطلاعی در دست نیست، اما میتوان گفت روش نصب آنها چیزی شبیه پردازنده های LGA خواهد بود.

با اولین نسل از تراشه های گرافیکی پاسکال آشنا شوید

کارت-گرافیک-Tesla-P100

GP100 از ۳۰۰ وات توان مصرفی استفاده میکند و همین مورد نشان میدهد در بخش خنک کننده باید شاهد تغییرات زیادی به نسبت کارت های فعلی باشیم. یعنی به خنک کننده بزرگتر وقوی تری نیاز داریم. در نهایت میتوانیم به برگ برنده ای مثل NVLink اشاره کنیم که به انویدیا اجازه میدهد با وجود این گذرگاه از ۸ کارت گرافیک در کنار هم استفاده کند! چیزی که در SLI فعلی و با گذرگاه PCIe 3.0 هم امکان پذیر نیست و محدودیت های خاص خودش را دارد.

منبع anandtech
راي شما
1 Star2 Stars3 Stars4 Stars5 Stars6 Stars7 Stars8 Stars9 Stars10 Stars
Loading...

نوشته شده در Intel /Nvidia,بررسی سخت افزار,کارت گرافیک

آخرین نقد و بررسی ها
بررسی مانیتور Samsung CFG70 27-Inch gaming

بررسی مانیتور Samsung CFG70 27-Inch gaming

تاريخ بررسي: ۲۶ آبان, ۹۶
بررسی کارت گرافیک ASUS ROG STRIX GTX 1060 OC 6GB

بررسی کارت گرافیک ASUS ROG STRIX GTX 1060 OC 6GB

۱۹ مرداد, ۹۶

9.0

بررسی کارت گرافیک Zotac GeForce GTX 1080 Ti AMP! Extreme

بررسی کارت گرافیک Zotac GeForce GTX 1080 Ti AMP! Extreme

۶ مرداد, ۹۶

9.6

بررسی کارت گرافیک Palit GTX 1080 GameRock Premium

بررسی کارت گرافیک Palit GTX 1080 GameRock Premium

۲۶ تیر, ۹۶

9.8

بررسی کارت گرافیک Sapphire Radeon RX 580 Nitro

بررسی کارت گرافیک Sapphire Radeon RX 580 Nitro

۲۳ اردیبهشت, ۹۶

9.2

روزی سگی، شیری را گفت: با من ستیز کن؛ شیر سر باز زد؛ سگ گفت: نزد تمام سگان خواهم گفت شیر از مقابله با من می هراسد. شیر گفت: سرزنش سگان را خوشتر دارم تا شماتت شیران، که گویند چون شیری باشد که با سگی پنجه در پنجه شده

×
تست و بررسی کامل کارت های گرافیکی GTX 970 & GTX 980
شاخه: Intel /Nvidia,بررسی سخت افزار,کارت گرافیک

تست و بررسی کامل کارت های گرافیکی GTX 970 & GTX 980

تــیم گارد3دی

تیم گــارد3دی (Guard3d.com) سعی بر ارائه مطالب متفاوت در زمینه سخت افزار و بازی دارد و امیدوار است در این زمینه بهترین عملکرد را داشته باشد . تیم گـــارد فعالیت خود را به صورت رسمی از تاریخ 2013-10-14 برابر با 1392-07-22 آغاز کرده و تمامی مطالب تولید شده توسط این سایت برای صاحبین آن محفوظ میباشد. کپی مطالب تنها با ذکر نام (Guard3d.com) مجاز است و ما از کپی مطالب بدون ذکر دقیق لینک منبع به صفحه مطلب راضی نیستیم. امیدواریم رضایت شما را جلب کنیم .

شبکه های اجتماعی

کپی رایت 2013 © تمامی حقوق نزد Guard3d محفوظ است | طراحی و کدنویسی توسط hosseincode

error: نمیتوانید کپی کنید!!! فقط لینک صفحه برای آدرس دهی به این مطلب قابل کپی است