Nvidia Kepler
خوب دوستان همونطور که چندی پیش فهمیدیم به خاطر مشکلات foundry issuesمربوط به TSMC که نظیرشو در fab 40 nm برای فرمی هم دیدیم باعث شده عرضه کپلر از 2011 به 2012 تاخیر پیدا کنه.
اما در این بین amd با معرفی معماری بسیار نوین GCN اطلاعات اولیه از نسل اینده GPU های خودش رو به ما داد که [ برای مشاهده لینک ، با نام کاربری خود وارد شوید یا ثبت نام کنید ] پیشتر به طور کامل روی معماری نسل اینده AMD/GPU صحبت شد.
اما در حال حاظر کم کم اطلاعات هرچند نا موثق و به قول خودشون FUB اما جالب از نسل اینده GPU های انویدیا در حال انتشاره که در فروم انویدیا پخش شده و ما بهش میپردازیم
MODEL___SKU___SP___ROP__core_CCLK__SCLK___M__blend __TMU__bus__Mtype__Mcap___TDP____Price
GTX690_GK100__32_*_24_=_768__825/__1650/_4600__72____96__512__GDDR5/ 2.00GB_270W__499 U.S. dollars
GTX680_GK100__32_*_22_=_704__750/__1500/_4200__66____88__448__GDDR5/ 2.00GB_230W__399 U.S. dollars
GTX670_GK104__48_*_12_=_576__825/__1700/_4600__48____96__384__GDDR5/ 1.50GB_190W__299 dollars
GTX660_GK104__48_*_11_=_528__725/__1450/_4200__44____88__320__GDDR5/ 1.25GB_155W__229 U.S. dollars
GTX655_GK104__48_*_10_=_576__650/__1300/_4000__40____80__256__GDDR5/ 1.00GB_130W__189 U.S. dollars
GTS650_GK106__48_*_6__=_288__800/__1600/_4600__24____48__256__GDDR5/ 1.00GB_105W__149 dollars
GTS640_GK106__48_*_5__=_240__700/__1400/_4200__20____40__192__GDDR5/ 1.00GB__80W__119 U.S. dollars
GT630__GK108__48_*_3__=_144__750/__1500/_2000__12____24__128__GDDR3/ 1.00GB__60W__89 U.S. dollars
GT620__GK108__48_*_2__=_96___700/__1400/_2000___8____16__128__GDDR3/ 1.00GB__45W__69 U.S. dollars
GT610__GK108__48_*_1__=_48___700/__1400/_2000___4_____8___64__GDDR3/ 1.00GB__30W__59 U.S. dollars
بیاید فرض کنیم 100 % اطلاعات بالا درست باشه.حالا ما میایم یک تحلیل روش انجام میدیم.
اول از همه نحوه نام گذاری تراشه فرمی هست که به جای GF100 در فرمی به صورت کد GK100 در کپلر که معادل همون در فرمی هست بر میخوریم.
not GF1xx GF = Fermi
new series GK = Kepler
در بالاترین سطح کارت های انویدیا ما GTX690 رو میبینیم که بر عکس پیش بینی ها تک هسته ای هست و این نشان از اعتماد به نفس انویدیا در مواجه با 2 هسته ای نسل اینده AMD یعنی 7990 رو میده.(امیدوارم پیش بینی انویدیا درست نباشه و مثل نسل گذشته GTX480 یا GTX490 عرضه نشده اون زمان توان رقابت با 5970 که اینجا جایگزینش میشود 7990 نداشته باشه.اما تجربه نشون داده انویدیا همیشه با علم به توان حریف جلو رفته)
--------------
در GTX690 ما 768 هسته پردازشی میبینیم که از انتظارات ما نسبت به نسل اینده بسیار کمتره.(حدا قل 1024 هسته در قیاس با GTX580 که همونطور که میدونیم GF110 که همون GF100 با فعال بودن تمام SM هاست بیش از 2 برابر GT200 هسته داشت )
------------
چیزی که در قسمت بعد باهاش مواجه میشیم تعداد SP های قرار گرفته در SM های هر یک از GK100 یا GK104 هست.
GK100
در GK100 ما میبینیم که در هر Stream multiprocessor تعداد 32 عدد SP یا Stream processor قرار گرفته.پس این نشون میده هر SM بسیار شبیه به فرمی GF100 هست.به شما تیک هر SM در فرمی توجه کنید
خوب میبینیم در هر SM فرمی ما 32 هسته داریم که یک ROP نهایی برای هرکدوم هست.اگر GK100 دارای 768 هسته کودا باشه نشون میده کپلر از 24 عدد SM تشکیل شده.یعنی میتونه همانند نسل قبلی در 4 تا GPC یا Graphic processing cluster که هرکدوم 6 تا SM دارن قرار بگیره.
در فرمی در هر GPC معادل با 4 تا SM قرار میگرفت و کلا 4 تا GPC داشت که میشد 16 تا SM در فرمی که شکل کلی GPU رو به صورت زیر ایجاد میکرد.
پس برای gk100 باید چیزی شبیه این باشه: (این تصویر فقط برای درک ذهنی هست و به هیچ عنوان حقیقت ندارد)
برای کپلر در هر GPC بجای 4 تا SM میتونید 6 تا SM درنظر بگیرید .GTX680 دارای 704 عدد هسته هستکه خوب پس به اینصورت 22 عدد SM داره یعنی 2 عدد از SM های GK100 غیرفعال شده.
بریم برای GK104 ببنیم اون به چه صورته.
GK104
خوب GK104 دقیقا مشابه GF104 هر SM دارای 48 تا پردازشگر هست.شکل زیر نمایش یک SM در فرمی GF104 هست:
برای GTX670 ما 576 هسته داریم یعنی اگر بر 48 تقسیم کنیم 12 عدد SM به ما میدهد.برای GF104 ما 8 عدد SM داشتیم که در 2 عدد GPC که هرکدام 4 تا SM داشتن قرار گرفته بود.بنابر این در هر GPC یه GK104 ما 6 عدد SM نوع 48 تایی داریم.
برای درک بهتر شکل زیر که برای GF104 هست رو مشاهده کنید:
میتونید اینطور تصور کنید که بجای 4 عدد SM در GF104 GPC در GK104 هر GPC دارای 6 تا هست. (این تصویر فقط برای درک ذهنی هست و به هیچ عنوان حقیقت ندارد)
البته نکته مهم اینه که انویدیا در این نسل به گفته خودش از پردازنده های ARM Base برای مقاصد خودش و احتمالا ایجاد پرفورمنس بهتر استفاده میکنه و تا زمانی که اطلاعات دقیقتر نیاد نمیشه نظر قطعی داد.اما فعلا با این اطلاعات ناقص نتیجه گیری اولیه این بوده.