کارتهای رادئون سری HD 7000 از دو ماه پیش به صورت رسمی معرفی شدند و از ابتدای سال ۲۰۱۲ به تدریج توسط سازندگان مختلف در مرحله تولید قرار گرفتهاند. این کارتها با اینکه یک تحول اساسی را نسبت به نسل قبلی نشان نمیدهند اما پیشرفتهای قابل توجهی در آنها دیده میشود که در جنبههای مختلف مانند کارایی، مصرف انرژی و قیمت قابل بحث هستند. معمولا صحبت در مورد خانواده تراشهها اندکی گیجکننده است با این حال میتواند تقسیمبندی کارتهای مختلف را نشان دهد و رده کارایی آنها را مشخص کند. تراشههای جدید AMD در سه گروه یا سه خانواده دستهبندی میشوند. تراشههای رده پایین که معمولا قیمت ارزانی دارند، در خانواده Verde قرار میگیرند و در سری HD 7700 طبقهبندی میشوند. گروه دوم که تراشههای متوسط را تشکیل میدهند در خانوادهای به نام Pitcairn هستند و سری آنها نیز HD 7800 است. در گروه سوم یا Tahiti تراشههای حرفهای قرار دارند که مدلهای سری HD 7900 را تشکیل خواهند داد. امسال هم AMD با اندکی خوششانسی کار خود را آغاز کرد زیرا هنوز خبری از کارتهای جدید انویدیا نیست. البته باید به این نکته هم توجه داشت که انویدیا معمولا تغییرات بیشتری را در کارتهای خود اعمال میکند با این حال در زمانبندی انتشار کارتهای گرافیکی این شرکت معمولا تاخیرهای زیادی دیده میشود. اولین کارتهای معرفیشده توسط AMD در رده حرفهای قرار دارند ولی این شرکت اعلام کرده است در هر سه گروه از سری HD 7000 در سه ماه نخست امسال محصولاتی را معرفی میکند.
فناوری بهکاررفته در کارتهای جدید از نوع ۲۸ نانومتری است و این موضوع تغییرات زیادی را به تراشه تحمیل میکند. تراشههای جدید دوبارهسازی شدهاند و اگرچه معماری آنها همان الگوی سابق را دارد اما آخرین دستاوردهای پردازش گرافیکی نیز به آنها افزوده شده است. این کارتها همچنین از نسل سوم پیسیآیاکسپرس پشتیبانی میکنند که پهنای باند آن در مقایسه با نسل دوم دو برابر شده است و به صورت دوسویه عمل میکند. این رابط در هر طرف میتواند ۱۶ گیگابایت بر ثانیه را انتقال دهد و در حالت دوسویه این پهنای باند به ۳۲ گیگابایت بر ثانیه میرسد. این دو فناوری شاخصترین تغییرات در کارتهای جدید رادئون سری HD 7900 است.
استفاده از فناوری ۲۸ نانومتری در ساخت تراشه این امکان را ایجاد میکند که مقدار بیشتری ترانزیستور در GPU قرار گیرد و در تراشه Tahiti،ا ۴.۳ میلیارد ترانزیستور استفاده شده است. این مقدار برای تراشههای گرافیکی بینظیر است و در تراشههای GTX 580 انویدیا نیز تعداد ترانزیستورها سه میلیارد بود.
ساختار تراشه
به دلیل افزایش تعداد ترانزیستورها معماری تراشه نیز اندکی تغییر کرده است. در نسل ششم کارتهای رادئون، AMD تصمیم گرفت با اندکی بازگشت به عقب از معماری پردازشی VLIW4 به جای VLIW5 استفاده کند و معتقد بود به دلیل ساختار تراشه، این معماری میتواند سرعت پردازش را تا ۲۰ درصد افزایش دهد. VLIW در واقع به نوعی شیوه پردازش در تراشهها مانند CPU و GPU گفته میشود. در پردازندههای محاسباتی و گرافیکی، دستورالعملها یک به یک مورد پردازش قرار میگیرند اما در این شیوه برخی از منابع پردازنده به طور کامل استفاده نمیشود و عملکرد آن را کاهش میدهد. برای رفع این نقص میتوان مانند معماری سوپراسکالر، زیرمجموعههای یک دستورالعمل را به طور موازی پردازش یا چندین دستورالعمل را به طور همزمان اجرا کرد. به این شیوه، اجرای خارج از دستور گفته میشود و VLIW نیز دقیقا همین کار را انجام میدهد، به طوری که در آن دستورالعملها با یکدیگر همسان هستند. در نسل هفتم این شیوه نیز کنار گذاشته شده است و روش جدیدی به نام GCN به کار رفته که از اساس ساختار و معماری تراشه را تغییر داده است. عبارت GCN به معنی «نسل بعدی معماری هستههای گرافیکی» است و در آن ساختار بلوکبندی تراشه تغییر کرده است. در GCN میزان بهرهبرداری از تراشه در هر دو قسمت محاسباتی و گرافیکی بهتر شده ضمن اینکه توان بیشتری برای پردازش دستورالعملها به کار گرفته میشود. AMD این شیوه را انقلابی در پردازشهای قابل اجرا توسط کارتهای گرافیکی میداند و مدعی است از این طریق توانسته است قدرتمندترین کارت گرافیکی تکهستهای را تولید کند. البته نتایج بهدستآمده نیز تا حدود زیادی این ادعا را تایید میکند.
در شیوه VLIW از معماری خوشهای استفاده میشد به این صورت که هستههای پردازشی یا پردازندههای استریم که خود از واحدهای ALU تشکیل شدهاند در خوشههایی به نام SIMD قرار میگیرند. در هر خوشه ۱۶ پردازنده استریم قرار دارد که هر کدام از آنها دارای چهار ALU است. بنابراین در یک ردیف، ۶۴ واحد پردازشی ALU قرار گرفته است. در روش VLIW زمانی که یک رشته دستورالعمل به واحدهای پردازشی میرسید تعدادی از این ALUها در سیکل اول فرکانس برای پردازش آن در نظر گرفته میشدند و مابقی غیرفعال باقی میماندند. در سیکل دوم فرکانس واحدهای بعدی به کار گرفته میشدند و این روند ادامه پیدا میکرد. البته گاهی رشتههای پردازشی هم پشت خوشهها متوقف میشدند زیرا تمام خوشهها درگیر دستورالعملهای قبلی هستند و این در حالی است که برخی ALUها غیرفعال باقی ماندهاند زیرا هر خوشه به یک رشته دستورالعمل اختصاص پیدا کرده و در این رشته ممکن است تعداد دستورالعملها اندک باشد و تمام واحدها را درگیر نکند، ضمن اینکه تا وقتی محاسبات این رشته پردازشی تمام نشده، کل واحد درگیر خواهد بود و ظرفیتی برای پذیرش دستورات بعدی ندارد. بنابراین میتوان گفت با اینکه این شیوه پردازش نسبت به قبل پیشرفتهای زیادی داشته و توان عملیاتی پردازنده گرافیکی را افزایش داده اما هنوز به کارایی مطلوب نرسیده است. برای رسیدن به این کارایی مکانیسم پردازش تغییر کرده و به معماری GCN رسیده است که در آن پردازش خطی برای هر چرخه فرکانس بهبود پیدا کرده است و موتورهای SIMD جای خود را به CU یا واحد محاسبات (Compute Unit) دادهاند.
در هر CU چهار واحد پردازش برداری یا VU قرار دارد که هر کدام دارای ۱۶ ALU هستند و در مجموع ۶۴ ALU به عنوان واحدهای محاسبه در یک CU دیده میشوند. تا اینجا میتوان گفت اختلاف زیادی با معماری قبلی دیده نمیشود و در واقع فقط نام SIMD به CU تبدیل شده است. اما تفاوت در اینجاست که برخلاف پردازندههای سایهزنی در یک موتور SIMD هر کدام از چهار واحد پردازش برداری میتوانند به صورت مستقل اجرا شوند و زمانبندی یا به عبارت دقیقتر SCHEDULING مستقلی داشته باشند. در نتیجه زمانی که یک موج پردازشی جدید وارد این موتورها میشود هر کدام از واحدها میتوانند رشتههای پردازشی را محاسبه کنند و درگیر زیرمجموعههای یک رشته نخواهند شد. به عنوان مثال میتوان گفت دستورالعملهایی که در معماری VILW به شش چرخه فرکانس برای اجرا نیاز داشتند، در GCN با چهار چرخه اجرا خواهند شد. به عبارت دیگر باید گفت قبلا ۶۴ واحد به صورت یکجا درگیر پردازش یک دستور میشدند که شاید با ۱۰ واحد پردازشی هم قابل اجرا بود اما اکنون به جای ۶۴ واحد تنها ۱۶ واحد اشغال میشود و این اجرا نیز به صورت مستقل و هوشمندانه است.
این موضوع میتواند یک جهش بسیار بزرگ برای کارتهای گرافیکی باشد زیرا از طریق آن کارتهایی با فرکانس پایین هم میتوانند پردازشها را سریعتر از قبل انجام دهند و حتی AMD مدعی است که از این طریق توانسته توانایی تراشه HD 7970 را نسبت به تراشه متناسب از سری قبلی یعنی مدل HD 6970 تا هفت و نیم برابر افزایش دهد. البته این مقدار از طریق محاسبات و به صورت تئوری به دست آمده است و در عمل کمتر خواهد بود، با این حال در گذشته زمانی که یک معماری جدید ارائه میشد، میزان افزایش توانایی کارت به صورت درصدی از ظرفیت قبلی بیان میشد، به این معنی که افزایش توان حتی به دو برابر نمیرسید و در اغلب موارد نیز زیر ۵۰ درصد بود و اگر بخواهیم نرخ جدیدی برای افزایش کارایی تعریف کنیم باید بگوییم میزان کارایی تا ۷۵۰ درصد افزایش پیدا کرده است. موتورهای پردازشی SIMD در نوع خود تجربه بسیار قابل توجهی را در کارتهای گرافیکی ایجاد کردند و همزمان با رادئونهای سری HD 2000 این موتورها نیز پا به عرصه پردازشهای گرافیکی گذاشتند.
در این پردازندههای گرافیکی یکی از مهمترین بخشها، واحد پردازش خطی (scalar unit) در واحدهای محاسبات (CU) است که به نوعی مسوول تقسیم کدها و محاسبات اعشاری است. این واحد نیز نوعی پردازنده محسوب میشود. این واحد، با تخلیه محاسبات خطی، کارایی واحدهای پردازشی را افزایش میدهد. در این تراشهها هر CU دارای چهار واحد پردازش بافتی است که آنها نیز با ۱۶ کیلوبایت حافظه کش L1 همراه هستند که قابلیت خواندن و نوشتن دارند و ظرفیت آنها هم نسبت به آنچه در معماری VLIW4 قرار داشت دو برابر شده است. در گذشته این حافظه فقط برای خوانش اطلاعات بافتی توسط پردازندهها مورد استفاده قرار میگرفت اما اکنون آنها میتوانند اطلاعات را روی این حافظه بنویسند.
تراشههای Tahiti
این تراشهها، رده حرفهای تراشههای جدید AMD را تشکیل میدهند و مدلهای HD 7970 و HD 7950 در این رده قرار دارند. ساختار این تراشهها از ۳۲ واحد محاسباتی یا CU تشکیل شده است که در هر کدام از آنها ۶۴ واحد ALU قرار دارد. در نتیجه در HD 7970 تراشه معادل ۲۰۴۸ واحد پردازشی ALU است. در این تراشهها فرکانس بالای ۹۰۰ مگاهرتز در دسترس است و میتوان با کمک اورکلاک فرکانس تراشه را به راحتی تا مقادیر بالای یک گیگاهرتز افزایش داد. در تراشه مرجع میزان فرکانس روی ۹۲۵ مگاهرتز تنظیم شده است، توان محاسباتی پردازنده گرافیکی نیز معادل ۳.۸ ترافلاپ محاسبه شده است که رقم قابل توجهی است. نکته دیگر به حافظه سطح L1 مربوط است که میتواند دو ترابایت بر ثانیه انتقال اطلاعات داشته باشد. این مقدار از مجموع پهنای باند میان واحدهای پردازشی به دست آمده است ضمن اینکه یک حافظه ۷۶۸ کیلوبایتی نیز در سطح L2 قرار دارد.
همچنین در این کارتها دو فناوری شاخص به کار رفته است. پاورتیون (PowerTune) برای افزایش کارایی کارت نسبت به توان مصرفی و نیز کاهش محدودیتهای ناشی از TDP استفاده میشود و فناوری دیگر که ZEROCORE نام دارد برای کاهش مصرف انرژی طراحی شده است.
ASUS HD7970-3GD5
ایسوس از اولین برندهایی بود که کارتهای مجهز به تراشه HD7970 را تولید کرد. در این کارتها از سه گیگابایت حافظه GDDR5 استفاده شده است و بر اساس رابط PCIE 3.0 طراحی شدهاند. میزان فرکانس تراشه همسان با مدل مرجع در نظر گرفته شده و ۹۲۵ مگاهرتز است. یکی از پیشرفتهایی که در این کارتها دیده میشود میزان فرکانس حافظه است که در ۵۵۰۰ مگاهرتز تنظیم شده است و البته این مقدار به عنوان فرکانس موثر کارت در نظر گرفته میشود زیرا فرکانس اصلی ۱۳۷۵ مگاهرتز است. رابط حافظه این کارت نیز از نوع ۳۸۴ بیتی است و پهنای باند زیادی را در اختیار کارت قرار میدهد. یکی دیگر از ویژگیهای این مدل تنوع پورتهای خروجی است و در پنل پشت کارت یک درگاه DVI و یک پورت HDMI دیده میشود که در کنار دو مینی Display Port قرار گرفتهاند.
در مدلهای حرفهای نسل ششم، AMD استفاده از دو بایوس برای کارتها را مطرح کرد که در این سری هم این گزینه موجود است. از طریق یک سوییچ کوچک که در بالای کارت و در کنار پل کراسفایر قرار گرفته است میتوان بایوس را تغییر داد که این موضوع بیشتر برای اورکلاکرها مورد استفاده قرار میگیرد. اورکلاک کارت گرافیکی نیز مانند مادربوردها از طریق اعمال تنظیمات روی بایوس انجام میشود و در یکی از این بایوسها میتوان تغییرات مورد نظر را ثبت کرد. بایوس دوم دارای تنظیمات پیشفرض کارخانه است و در صورتی که تنظیمات اورکلاک با مشکل مواجه شود میتوان از این طریق کارت را در حالت مطمئن راهاندازی کرد.
ایسوس برای اورکلاک کارت از ابزاری به نام ASUS GPU Tweak استفاده میکند که تنظیمات کاملی در محیط ویندوز در اختیار کاربر قرار میدهد. از طریق این ابزار علاوه بر تغییر فرکانس میتوان مواردی مانند ولتاژ و سرعت فن را هم تعیین کرد ضمن اینکه امکان مانیتورینگ کامل کارت نیز وجود دارد.
بابک نقاش [email protected]
منبع
.: مهنا :....
ما را در سایت .: مهنا :. دنبال می کنید
برچسب : نویسنده : مهدی و سینا mahna بازدید : 903 تاريخ : يکشنبه 12 شهريور 1391 ساعت: 17:45