ورود

نسخه کامل مشاهده نسخه کامل : بررسی کامل معماری Nehalem وپردازنده هایCore i7



street king
02-06-2009, 14:40
بررسی کامل معماری Nehalem وپردازنده هایCore i7

مقدمه

حال پس از گذشت چندماه از عرضه پردازنده‌هاي Corei7 شايد در نگاه اول به تيتر مقاله كمي صحبت در مورد اين نسل از پردازنده‌ها، چندان تازگي نداشته باشد، اما با توجه به هدف اين مقاله مبنی بر بررسي کامل معماري و كارآيي اين پردازنده‌ها در مقابل پردازنده‌هاي Phenom II شركت رغيب يعني AMD كه چندي پس از عرضه پرازنده‌هاي Corei7 معرفي و عرضه شدند اين اجازه را به ما مي‌دهد كه در مورد سوال هميشگي اين كه كدام پردازنده بهتر است، تا حدي و به گونه‌اي كلي نيز اظهارنظر كنيم.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

در ابتدا قصد داشتيم 2 مقاله در مورد مباحث تخصصي و جزئيات معماري Nehalem و كارآيي Corei 7 ارائه كنيم اما به دليل ارتباط مستقيم دو مبحث و درك بهتر مباحث در كنار هم پرونده‌اي هر چه كامل‌تر از اين پردازنده‌ها را ارائه كنيم لذا سعي شده است تا حد امكان از زباني ساده و قابل فهم براي نگارش اين مطلب استفاده شود تا همه‌ي خوانندگان محترم بتوانند استفاده‌اي مفيد از اين مبحث شيرين ببرند.



...و اما Core i7 :
در مورد موفقيت معماري Nehalem بدون شك تاكنون صحبت‌هايي شنيده‌ايد و ميتوان گفت هيچ ترديدي درموفقيت اين نسل از پردازنده‌ها نيست اما ايده این معماري موفق از كجا سرچشمه گرفته است؟
از AMD اين شايد جواب بسياري از شما خوانندگان محترم و حتي تیتر چندي از سياست‌هاي معتبر جهاني باشد. انتقال كنترلر حافظه از پل شمالي به داخل پردازنده، حافظه‌ي مشترك سطح L3 كه تاثير بسزايي در كارآيي و موفقيت اين پردازنده‌ها بجا گذاشته‌اند در ظاهر همه از تكنولوژيهاي AMD است ، براي صحت و يا عدم صحت اين عقيده اجازه بدهید به 8 سال قبل بازگرديم سال 2001 بود كه صحبت‌ها در مورد ايده انتقال كنترلر حافظه به درون پردازنده از طرف AMD شروع شده بود كه در طرف مقابل اینتل همچنان به افزايش فركانس كاري معتقد بود و برآن پافشاري مي‌كرد و بالاخره AMD اين ايده را در سال 2003 در پردازنده‌هاي 64 بيتي خود پياده كرد اما اين معماري خود تقليدي از پردازنده‌هاي Power P4 شركت IBM بود و اساس ان متعلق به IBM بوده و هست و در طرف مقابل نيز اینتل بود که براي اولين بار در معماري NetBurst از حافظه نهان سطح 3 (L3) با ظرفيت 2 مگابايت در پردازنده های P4 Extreme استفاده كرد، پس ديگر نمي‌توان تهمت تقليد از AMD را به معماري Nehalem شركت اينتل زد، در ادامه متوجه مي‌شويد كه معماري Nehalem بيشتر الهام گرفته از پردازنده‌هاي سرور مي‌باشد و اين سياست‌هاي زيركانه اینتل بوده است كه با تركيب عوامل كارآمد توانسته اين موفقيت چشمگير را رقم بزند.

kevin
02-06-2009, 14:42
خیلی از نظر کارکرد وسرعت جالب هستند ولی از نظر قیمت نه . . . !!!

street king
02-06-2009, 14:43
نگاهي اجمالي به پردازنده‌هاي Corei7:

پردازنده‌هاي Corei7 اولين نسل از پردازنده‌هاي مبتني بر معماري Nehalem هستند و از 4 هسته با نام Bloomfield با پروسه ساخت 45 نانومتري واز سوکت LGA 1366بهره مي‌برند (همچنين بايد متذكر شوم كه پياده‌سازي هسته‌هاي Corei7 به روش يكپارچ (monolithic) مي‌باشد) كه با استفاده از تكنولوژي Hyper Threading هر هسته قادر به پردازش دو عمليات به صورت همزمان مي باشد. (پردازنده های Corei7 توانایی پردازش 16 دستورالعمل را به صورت همزمان دارد).
با انتقال كنترلر حافظه به درون پردازنده ديگر FSB حذف و جاي خود را به رابط QPI (Quick Patch Interconnect) داده و فقط از حافظه‌هاي DDR3 پشتيباني مي‌كند كه حافظه‌ها را نيز مي‌توان به صورت سه كاناله (Triple Channel) نيز پياده‌سازي كرد.
پردازنده‌هاي Corei7 داراي 3 سطح حافظه نهان Cache) L3, L2, L1) بوده كه مقدار هركدام به ترتيب 8MB, 2MB, 256KB مي‌باشد.
در اين نسل از پردازنده‌ها سوكت پردازنده نيز از اين سير تحولات در امان نبوده و به LGA 1366 تغيير يافته و براي پشتيباني اين نسل از پردازنده‌ها بايد از مادربردهاي مبتني بر چيست X58 (چيپست طراحي شده براي پردازنده‌هاي Corei7) بهره برد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

پشتيباني ازهردو تكنولوژي 3-way 8LI, CrossFire-x ، دستورهاي SSE 4.2 ، تغیرات TLB و SMT و... ازديگر ويژگي‌هاي اين پردازنده‌هاي قدرتمند است كه در ادامه‌ي مقاله به تشريح كامل جزئيات هريك از اين فناوريها و مطالب بالا مي‌پردازيم.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 14:45
Core 2 VS Cori7 VS PhenomII

به دليل گستردگي مطالب فني هر نسل از پردازنده‌ها در اين بخش از مقاله تنها به صورت اجمالي به بيان تفاوتهاي بين پردازنده‌هاي Corei 7 با پردازنده‌هاي Core 2, Phenom مي‌پردازيم كه درجدول زير مي‌توانيد تمام جزئيات هر يك از معماري‌ها را ببينيد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

حال با توجه به درك تفاوتهاي موجود بين نسل‌هاي مختلف پردازنده‌ها يعني Core 2 نسل پيشين اينتل و فنوم شركت AMD توجه شمار را به نتايج تست‌هاي بدست آمده جلب مي‌كنم.
در جدول زیر اختلاف کارایی پردازنده Core i7 965 با دو پردازنده QX9770 و Phenom X4 9550 Black مشخص شده است.(برای مثال در تست Crysis پردازنده Phenom X4 33.7 درصد و پردازنده QX9770 از اینتل 12.1 درصد کندتر(slower) از Core i7 965 ظاهر شده اند.)


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

همانطور كه مشاهده مي‌كنيد پردازنده‌هاي Corei7 برتري بسيار چشمگيري نسبت به ديگر پردازنده‌ها داشته‌اند.
پردازنده‌هاي Corei7 داراي 5 مدل مختلف بودكه 3 مدل ابتدايي تا كنون به بازار عرضه شد و 2 مدل ديگر نيز تا چندي ديگر به بازار عرضه مي‌شوند.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

تفاوت کارایی پردازنده های Corei7 نسبت به یکدیگر را نیز می توانید در جدول زیر مشاهده کنید:


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

طبق رسم و رسوم شرکت اینتل اين بار نيز پردازنده‌ها در 2 دسته‌ي مختلف معمولي و Extreme عرضه شده‌اند كه 975 و Corei7 965 تنها پردازنده‌ های سري Extreme اين نسل می باشند كه با ضريب multiplier باز (unlock) بيشتر باب میل اوركلاکرها هستند.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 14:46
رابط QPI گذرگاهی برای عبور از محدودیت :

اين بار ديگر اينتل توانست از (FSB (Front Side Bus دل بكند و آنرا كنار بگذارد چرا كه اين رابط كند با مشكلات و معايبي كه داشت ديگر نمي‌توانست جوابگوي چنين معماري قوي باشد وباعث شد اينتل از گذرگاه جديدي با نام Quick Patch Interconnect) QPI ) در معماري Nehalem استفاده كند.
QPI براي ارتباط بين پردازنده‌ و حافظه‌ها و از دو مسير جداگانه جهت ارسال و دريافت داده استفاده مي‌كند.
ارتباط پردازنده- حافظه و پردازنده- IO با استفاده از اتصالات نقطه به نقطه پهناي باندي معادل 8/4 گيگاتكسل در ثانيه را در حالت يكطرفه ايجاد مي‌كند كه در حالت دو طرفه اين مقدار به 6/9 گيگاتكسل در ثانيه مي‌رسد اين نرخ انتقال براي پردازنده‌هاي 920, 940 بوده و براي پردازنده i7 965 پهناي باندي معادل 4/6 گيگاتكسل در حالت يكطرفه و 8/12 گيگاتكسل در حالت 2 طرفه ايجاد مي‌كند.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

رابطه QPI در واقع يك رابط سريال به نام Common System Interface) CSI) با اتصال نقطه به نقطه است كه داراي دو مسير ارسال و دريافت به صورت مجزا مي‌باشد عرض هر يك از اين مسيرها 20 بیت بوده كه 16 بيت آن براي انتقال داده و 4 بيت آن نيز براي كدهاي كشف خطا استفاده مي‌شود.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

اگر مشخصات پردازنده QX 9770 (قويترين پردازنده Core 2 ها) را بخاطر داشته باشيد متوجه مي‌شويد كه پهناي باند i7 965 دقيقا برابر QX 9770 است حال اين سوال پيش مي‌آيد كه چرا Corei7 سريعتر است؟
همانطور كه گفته شد QPI داراي دو مسير مجزا براي خواندن و نوشتن است يعني 8/12 گيگاتكسل براي خواندن و 8/12 گيگاتكسل براي نوشتن در صورتيكه در پردازنده QX 9770 اين پهناي باند براي هر دو عمليات خواندن و نوشتن به صورت اشتراكي استفاده مي‌شود و از طرف ديگر در FSB داده‌هاي مربوط به هر دو بخش I/O وحافظه‌ها بايد انتقال پيدا كند اما در مقابل يعني در QPI تنها داده‌هاي مربوط به I/O انتقال مي‌يابد (در Corei7 ديگر داده‌اي مربوط به حافظه انتقال نمي‌يابد چرا كه كنترلر حافظه به درون پردازنده‌ انتقال يافته است). بنابراين حجم تبادل اطلاعات در FSB بيشتر از QPI است كه باعث مي‌شود پهناي باند قابل دسترس Core i7 نسبت به Core 2 بيشتر شود. اينتل همچنين براي جبران پايين بودن نرخ انتقال اطلاعات در Core i7 نسبت به Core فركانس كاري را افزايش داده است. حال ديگر كاملا مطمئن مي‌توانيد نتيجه‌گيري كنيد كه QPI بسيار سريعتر از FSB است.

street king
02-06-2009, 14:48
كنترلرحافظه‌مجتمع و یکپارچه :

شايد اقدام اينتل براي انتقال كنترلر حافظه از چيپست به درون پردازنده كمي دیر انجام شد اما بسيار كاملتر و مفيدتر از كنترلر حافظه‌ي پردازنده‌هاي AMD ظاهر شده است كنترل كننده داخلي پردازنده‌هاي Corei 7 قابليت دسترسي به 3 ماژول حافظه از نوع DDR3 را به صورت همزمان و موازي (3 كاناله- Triple Channel) سرعتی معادل 25.4 Gb/s برای انتقال اطلاعات فراهم مي‌كند كه در مجموع پردازنده در هر سيكل به 192 (64×3) بيت دسترسي خواهد داشت در صورتيكه در پردازنده‌هاي مبتني بر معماري K10 شركت AMD اين رقم 128 (64×2) بيت بوده كه تنها از حافظه‌هاي DDR2 نيز پشتيباني مي‌كردند (البته در پردازنده‌هاي Phenom IIAMD با سوكت AM3 و پلتفورم Dragon قابليت پشتيباني از حافظه‌هاي DPR3 فراهم شده است).


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

كنترلر حافظه پردازنده‌هاي Corei7 توانسته به خوبي پهناي باند را نسبت به Core2 تا دو برابر افزايش (حداكثر 32 گيگابايت در ثانيه) و زمانهاي تاخير دسترسي به حافظه را كاهش دهد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

همچنين بنابر اعلام شركت اينتل در حالت تئوري استفاده از حالت 3 كاناله، پهناي باند را در مقايسه با حالت 2 كاناله تا 50 درصد افزايش مي‌دهد. فركانس پايه پردازنده‌هاي Corei7 برابر 133 مگاهرتز است كه در مدلهاي 940, 920 با ضرايب 6 و8 تنها از حافظه‌هاي DDR3- 1066- DDR3- 800 مي‌كند اما در پردازنده i7 695 با توجه به پشتيباني از ضرايب 10 و12 ميتوان از حافظه‌هاي بافركانس 1600 , 1333 نيز بهره برد (در مدلهاي Core 2 QX 9770 قابليت پشتيباني از حافظه‌هاي با فركانس 1600 را دارا مي‌باشد. نيز تنها پردازنده
استفاده از حالت 3 كاناله ازديگر ويژگي‌هاي جديدي بود كه اينتل بر روي آن مانور تبليغاتي مي‌داد كه طبق اعلام شركت اينتل استفاده از حالت 3 كاناله، در حالت تئوري پهناي باند را تا 50 درصد نسبت به حالت 2 كاناله (Duall Channell) افزايش مي‌دهد حال اگر به نتايج بدست آمده توجه كنيد متوجه مي‌شويد كه تفاوت بسياركمي (کمتر از ا درصد) بين حالت 2 كاناله و 3 كاناله وجود دارد و درحال حاضر استفاده از حالت 3 كاناله اصلا به صرفه نيست.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 14:49
حافظه نهان 3 سطحی ایده ای قدیمی:

معماري Nehalem حافظه نهان پردازنده‌هاي Corei 7 را نسبت به پردازنده‌هاي قبلي شركت اينتل دستخوش تحولات بسياري كرد اينتل براي اولين بار در پردازنده‌هاي چهارهسته‌اي خود از 3 سطح حافظه نهان (Cache) استفاده كرد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

حافظه كش سطح L1 تنها حافظه نهاني بود كه تغييري پيدا نكرد و همانند قبل از 64 كيلوبايت حافظه نهان براي هر هسته استفاده شد كه 32 كيلوبايت آن براي داده‌ها و 32 كيلوبايت ديگر براي كدها (دستورالعمل‌ها) اختصاص دارد و در مجموع 256 كيلوبايت كش سطح L1 را تشكيل مي‌دهند .تنها تغییر بوجود امده در حافظه نهان سطح L1افزایش زمان تاخیر از 3 سیکل به 4 سیکل است.
اما كش سطح L2 تغييرات مثل همیشه تغییرات زيادي پيداكرده است، پردازنده‌هاي قبلي با هسته‌هاي PenrynConroe و چهار هسته‌ايهاي kentsfield, yorksfield از حافظه نهان سطح L2 به صورت اشتراكي با حجم بالا (2و3و6و8و12 مگابايت) بهره مي‌بردند اما اين بار تنها يك مگابايت فضا به حافظه نهان سطح L2 اختصاص داده شده است كه براي هر هسته 256 كيلوبايت به صورت اختصاصي در نظر گرفته شده است اما اينتل براي جبران كاهش حجم کاشه سطح L2 و بهبود عملكرد و كارايي با كاهش سيكل‌هاي تغيير از 15 سيكل به 10 سيكل زمانهاي تاخير را كاهش داده و سرعت دسترسي به داده‌ها را افزايش داده است (حافظه نهان L2 در پردازنده‌هاي فنوم نيز به صورت اختصاصي است) .


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

از دیگر تغیراتی که در حافظه نهان سطح 1و2 ایجاد شد استفاده از 8 ترانزیستور بجای 6 ترانزیستور درمعماری core بدلیل تغییر ارایش جدید حافظه نهان صورت گرفت .
سیر تحولات حافظه L2 از ابتدا تا کنون را در نمودار زیر می توانید مشاهده کنید.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

و اما حافظه نهان سطح L3 كه تاثير بسزايي در افزايش كارآيي پردازنده دارد و به عقيده‌ي بسياري در نگاه اول تقليد از پردازنده‌هاي فنوم شركت AMD است، همانطور که در ابتدا گفته شد استفاده از 3 سطح حافظه نهان اولین بار توسط اینتل صورت گرفت در ادامه نیز متوجه خواهيد شد كه تفاوت بسياري بين معماري دو شركت در طراحي كاشه سطح L3 وجود دارد.
در معماري Nehalem هر هسته براي دسترسي به يك داده اگر داده‌ي مورد نظر در حافظه نهان L3 وجود نداشته باشد پردازنده با اطلاع از موجود نبودن داده، ديگر به جستجوي داده در هسته‌هاي ديگر درگير نمي‌شود كه باعث مي‌شود زمان تاخير در دسترسي به اطلاعات كاهش يابد و در صورتيكه داده مربوطه در حافظه نهان سطح L3 وجود داشته باشد مي‌توانيد از چهارمسير مجزا (هر هسته 1 مسير) به داده‌ها دسترسي پيدا كند كه باعث كاهش حجم مبادلات بين هسته‌ها مي‌شود و همچنين از وابستگي حافظه‌هاي نهان اختصاصي هرهسته به حافظه‌ي اختصاصي هسته‌هاي ديگر كاسته مي‌شود.
از ديگر ويژگي‌هاي طراحي حافظه نهان در Corei7 امكان دسترسي همزمان هر چهارهسته به داده‌هاي موجود در سطح L3 است كه باعث مي‌شود پردازنده در پردازش‌هاي چند رشته‌اي و multi tasking سريعتر عمل كند همچنين بنابر اعلام شركت اينتل سرعت تبادل داده‌ها بين هسته‌هاي مختلف نسبت به پردازنده‌هاي Core 2 نيز افزايش يافته است. اما در طراحي حافظه نهان پردازنده‌هاي اينتل همچنان مشكلاتي وجود دارد، پهناي باند حافظه نهان سطح L2 براي اجراي دستورالعمل‌ها همانند پردازنده‌هاي قبلي همچنان برابر 16 بايت در هر سيكل است (درپردازنده‌هاي فنوم برابر 32 بايت در ثانيه) و از آنجا كه پردازنده‌هاي مبتني بر معماري Nehalem داراي 1 كد گشاي بيشتر نسبت به پردازنده‌هاي فنوم هستند باعث شده فشار بيشتري روي حافظه نهان سطح L2L1 نسبت به قبل از 3 به 4 افزايش يافته و موجب مي‌شود سرعت حافظه نهان سطح L1 را بيش از پيش كاهش دهد. مشكل ديگري در حافظه نهان وجود دارد و بين هر دو پردازنده‌هاي اينتل و AMD نيز مشترك است اين است كه هر حافظه نهان به طور مستقل داده و دستورالعمل را در خود ذخيره مي‌كند كه باعث مي‌شود فضاي حافظه نهان با داده‌هايي موجود در سطوح ديگر حافظه نهان از بين برود. وارد شود كه در صورت اجراي دستورالعمل‌هاي 64 بيتي اين مشكل بيش از پيش نمايان مي‌شود اما مشكل به همين جا ختم نمي‌شود، زمان تاخير نيز در حافظه سطح
اما در كل حافظه نهان اشتراكي سطح L3 اينتل با 8 مگابايت فضاي در دسترس كمك عمده‌اي به بهبود كارايي پردازنده‌هاي Corei7 در پردازش‌هاي سنگين و به خصوص نرم‌افزارهاي تك رشته‌اي كرده است.
سیر تحولات مجموع حافظه L2+L2 از ابتدا تا کنون را نیز در نمودار زیر مشخص شده است.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 14:51
Hyper Threading راهكاري از گذشته:

اینتل تكنولوژي Hyper Threading (چند بندي) را ابتدا در سال 2003 در پردازنده‌هاي (Pentium D, Pentium 4 (NetBurst معرفي كرد كه در آن زمان بدليل عدم سازگاري نرم‌افزارها با اين تكنولوژي و هم چنين مشكلات موجود در معماري كه گاه مصرف توان را نيز تا حد نسبت زيادي بالا مي برد نتوانست موفق ظاهر شود و پس از آن اينتل را كنارگذاشت و اين بار دو مرتبه در پردازنده‌هاي Corei7 استفاده كرده است.
به زبان ساده تكنولوژي Hyper Threading را اينگونه ميتوان تشريح كرد كه اين تكنولوژي هر هسته را قادر مي‌سازد كه دو كد مستقل (Thread) را به طور همزمان اجرا كند هر هسته پردازنده‌هاي مبتني بر اين معماري در اصل شامل دو هسته منطقي ميباشد كه هركدام حالت كاري مخصوص به خود را دارا مي‌باشند در اين صورت سيستم عامل مي‌تواند هر هسته پردازنده را به عنوان دو هسته بشناسد، شما با بازكردن پنجره Task Manager در سيستم عامل مي‌بينيد كه سيستم عامل پردازنده Corei7 را با 8 هسته مي‌شناسد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

اما چرا Hyper Threading:
درطراحي پردازنده‌ها، واحدهاي اجرايي از مهمترين قسمت‌هاي پردازنده‌ مي‌باشد كه ميتواند تاثير بسزايي در كليه بخش‌هاي پردازنده داشته باشد اما اين واحدهاي اجراي هر چه بهتر بتوانند تغذيه شوند مي‌توانند عملكرد بهتري داشته باشند، اجراي چندين كد مستقل (Thread) به صورت همزمان بهترين روش براي تغذيه مناسب واحدهاي اجرايست چرا كه در اين روش تعداد ترانزيستورها و اندازه هسته به اندازه كمي افزايش پيدا مي‌كند اين روش (Hyper Threading) ميتوان بهره‌گيري از يك واحد اجرايي هر هسته را به ميزان 2 برابر افزايش داد اين كار تنها با ارسال 2 كد مستقل (Thread) از دستورالعمل‌ها به صورت همزمان به هر يك از هسته‌هاي پردازنده و بدون نياز به افزايش واحدهاي اجرايي قابل اجرا است.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

بهره‌گيري از تكنولوژي Hyper Threading در معماري Nehalem همانطوركه در نتايج زير مي‌بينيد گاه تا 35 درصد باعث افزايش كارآيي شده است (اين رقم در پنتيوم‌ها تنها 4 تا 5 درصد بود) البته در مواردي نيز كه نرم‌افزارها قادر به تشخيص اين معماري نيستند باعث كاهش كارآيي شده است كه كاربر با درك اين مطلب مي‌تواند با فعال كردن به موقع اين تكنولوژي استفاده‌اي مطلوب از آن ببرد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

در ادامه‌ي مقاله در بخش SMT دليل اين افت كارآيي را به صورت كامل توضيح خواهيم داد.

street king
02-06-2009, 14:52
دستورات SSE 4.2 کامل تر از همیشه :

مجموعه دستورات Streaming SIMD Extensions) SSE) ابتدا در سال 1999 توسط اينتل معرفي شد. دستورالعمل‌هاي SSE 4 شامل 54 دستورالعمل جديد است كه با توليد پردازنده‌هاي 45 نانومتري متولد شدند كه 47 دستورالعمل آن در پردازنده‌هاي 45 نانومتري با معماري Penryn تحت عنوان SSE 4.1 ارائه شدند و 7 دستورالعمل باقي مانده در پردازنده‌هاي مبتني بر معماري Nehalem عرضه شدند كه زير مجموعه دستورات SSE 4.2 ناميده مي‌شدند (SSE 4.2 از تمامي 47 دستورالعمل SSE 4.1 هم پشتيباني مي‌كند).
هدف از ارائه دستورالعمل‌هاي SSE4 افزایش Performance در برنامه های چند رسانه ای ، imaging ، و برنامه های کار با object های 3 بعدی هست . این دستورات باع افزایش کارایی کامپایلر های برداری و همچنین شامل پک هایی از دستورالعمل هایی هست که افزایش محاسبات Dword یا همان Text Processing را در بر دارد .
این دستورالعمل ها همچنین عملیاتی رو میسر می سازند که طی آن توان عملیاتی Memory در زمانی که اطلاعات از uncacheable WC memory خوانده میشوند افزایش پیدا میکند .
كه در زير مي‌توانيد مجموعه دستورالعمل‌هاي SSE 4.2 , SSE 4.1 رامشاهده كنيد:

مجموعه دستورالعمل های SSE 4.1
• دستورالعمل که نقش ضرب کننده های پک dword رو ایفا می کنند .
• دستورالعمل که تولید نقطه ای داده های floating-point همراه با گزینش خروجی و ورودی داده ها رو بر عهده دارند .
• دستورالعمل که وظیفه بارگذاری به همرا یک streaming hint رو در بردارد
•دستورالعمل که ساده سازی دادهای blend را بر عهده دارد .
•8 دستورالعمل که پشتیبانی از حداقل و حداکثر اعداد صحیح را توسعه می دهد
• دستورالعمل که گرد کردن داده های floating-point به همراه روش گرد کردن انتخابی و دقت لغو کردن استثناء ها را پشتیبانی می کند .
• دستورالعمل که ورود داده ها و استخراج آن ها را از رجیستر های XMM بهبود می بخشد.
• دستورالعمل که باعث بهبود تبدیل داده های عدد صحیح می شوند ( علامت و پسوند های مبدآ (
• دستورالعمل که باعث بهبود SAD (sum absolute difference)i جهت کوچک تر شدن بلوک ها میشود
• دستورالعمل که به جست و جوی عملیات افقی کمک میکند .
• دستورالعمل که مقایسه های ماسک شده رو بهبود می بخشد .
• دستورالعمل که باعث اضافه شدن بسته های ، برابری مقایسه های ، داده های qword میشوند .
• دستورالعمل که باعث اضافه شدن بسته های Dword به همراه اشباع شدن بی علامت میشود .

مجموعه 7 دستورالعمل SSE 4.2
• رشته سازی و محاسبات واژه که میتواند با استفاده از یک دستور ، دستور العمل های چندگانه را برنامه ریزی کند .
• دستورالعمل های Application-targeted accelerator (ATA)i
• دستورالعمل SIMD (Single Instruction, Multiple Data)i که افزایش ظرفیت 128bit ی اعداد صحیح SIMD در SSE4.1 می شود
5 مورد از مجموعه دستورالعمل‌هاي اضافه شده در پردازنده‌هاي Corei7 كه تحت عنوان SSE 4.2 از آن يادكرديم باعث افزايش سرعت پردازش فايل‌هاي XML و دستورالعمل ديگر در تشخيص صدا و DNA مي‌تواند موثر واقع شود وآخرين دستورالعمل اين مجموعه (CRC32) نيز براي شتاب‌دهي در محاسبات كدهاي تشخيص خطا استفاده مي‌شود.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

(پردازنده‌هاي Corei7 همچنين از تمامي دستورات EM64, MMX, SSE3, SSE2, SSE نيز پشتيباني مي‌كند).

street king
02-06-2009, 14:53
SMT:

معماري Nehalem توانست انقلابي را در عرصه معماري پردازنده‌ها بوجود آورد اينتل در تمامي قسمتهاي ساختاري و زيربخش نيز تحولات بسياري ايجاد كرد واحد SMT نيز از اين قاعده مستثني نيست.
درمعماري Nehalem با توجه به افزايش دستورالعمل‌هاي اجرايي و با توجه به اينكه نحوه‌ي كاركرد SMT كه هميشه بار بيشتري را روي موتوراجرايي و آن هم خارج از ترتيب اعمال مي‌كند اينتل براي جلوگيري از كندشدن ورودي بافرها، بافرهاي Reorder (بافرهايي هستند كه داده‌هاي مربوط به دستورالعمل‌هاي از پيش اجرا شده را در خود ذخيره مي‌كند) را به 128 ثبات افزايش داده اين در حاليست كه در معماري قبل Core 2 اين رقم 96 ثبات بوده است. اما در عمل، بافرهاي Reorder تقسيم‌بندي مي‌شوند تا هركدام از كدهاي مستقل (Thread) تنها به يك بخش از بافر دسترسي داشته باشند و نتواند همه‌ي منابع را در اختيار خود نگه دارند. حال با SMTHyper Threading چند مورد كاهش كارآيي را به خاطر داشته باشيد، اين كاهش كارآيي تنها در نرم‌افزارهايي رخ مي‌دهد كه با تكنولوژي Hyper Threading به گونه‌اي مشكل دارند (البته اين مشكل بيشتر پيش پاي برنامه‌نويسان است). اندازه‌ي هر يك از اين بخش‌ها تنها به 64 ثبات پيدا مي‌كنند ولي در صورتيكه حتي يك كد مستقل به
صورت فردي اجراء شود، مي‌تواند به همه ثبات‌ها دسترسي پيدا كند كه باعث كاهش كارآيي مي‌شود،


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

در بخش Unified Reservation Station ( ایستگاه یکپارچه رزرواسیون بخشي كه با شناسايي دستورالعمل‌هاي مختلف دستورالعمل‌ها را بخش‌هاي اجرايي متفاوت ارسال مي‌كند) نيز اينتل اندازه‌ي بافرها را از 32 ثبات به 36 ثبات افزايش داده است، اما در اين بخش پردازنده در موارد خاص با افت كارآيي روبه‌رو نمي‌شود چرا كه تقسيم‌بندي ديناميكي ثبات‌ها اين اجازه را به Thread هاي مختلف مي‌دهد كه بسته به دستورالعمل خود به صورت هوشمند از ثبات‌ها استفاده كنند. (ایستگاه رزرواسیون تنها بخشي است كه قابليت تقسيم‌بندي دنياميكي را دارد). همچنين اندازه‌ي بافر بارگذاري و ذخيره‌سازي نيز از 32 ثبات به 48 ثبات برای واحد بارگذاري و از 16 ثبات به 32 ثبات برای واحد ذخيره‌سازي افزايش پيدا كرده است.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

با تمامي اين تفاسير SMT بيشتر مواقع تاثير مثبت بركارآيي پردازنده و به خصوص در نرم‌افزارهاي كاربردي داشته است.

street king
02-06-2009, 14:54
TLB :

اين بخش نيز همانند بخش‌هاي قبلي (SMT) تغييرات زيادي داشته است (و حتي بيشتر) در اين بخش نيز ابتدا مفهوم و وظيفه TLB را بيان مي‌كنيم.
Translation Lookside Buffe) TLB) در اصل يك حافظه نهان بسیار کوچک است(Cache) كه به منظور جلوگيري از افت سرعت پردازنده در دسترسي به حافظه طراحي شده ، اين حافظه نهان كوچك براي اين كار اندكي از آخرين آدرس‌هايي كه به حافظه دسترسي داشته‌اند را در خود ذخيره مي‌كند.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

TLB نيز همانند SMT بدليل افزايش دستورالعمل‌ها و همچنين افزايش سطوح حافظه نهان مي‌بايست دستخوش تحولات زيادي قرار مي‌گرفت.
معماري Nehalem برخلاف معماري Core 2 يك TLB دو سطحي واقعي بهره مي‌برد (چيزي كه تا قبل از اين تنها در پردازنده‌هاي سرور مي‌ديديم).
TLB سطح يك بين داده‌ها و دستورالعمل‌ها به اشتراك گذاشته شده است كه توانايي ذخيره‌سازي داده‌ها با 32 ثبات براي صفحات بزرگ و 64 ثبات براي صفحات كوچك را دارد اين درحاليست كه در معماري Core تنها 16 ثبات براي هر دو صفحات كوچك و بزرگ در نظرگرفته شده بود و همچنين براي ذخيره‌سازي دستورالعمل‌ها نيز از 7 ثبات براي صفحات كوچك و 128 ثبات براي صفحات بزرگ بهره مي‌برد.
در معماري Nehalem ، TLB سطح دو كمي با سطح يك متفاوت است در TLB سطح دو ذخيره‌سازي داده‌ها و دستورالعمل‌ها (كدها) به صورت مشترك است و اعضا فقط براي صفحات كوچك در نظر گرفته شده است و تا 512 ثبات را نيز مي‌تواند در خود ذخيره كند، تغييرات اعمال شده در TLB موجب افزايش كارآيي پردازنده‌ها در برنامه‌هاي كاربردي شده است.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 14:56
رمزگشايي دستورالعمل‌ها:

تا به اين جاي كار در اكثر واحدها شاهد تغيير و تحولات زيادي بوده‌ايد اما واحد رمزگشايي دستوراالعمل‌ها نسبت به معماري Core 2 تغييرات چنداني نداشته است و فقط جزئيات اين واحد دچار پيشرفت شده است، اما اين عدم تحول نيز بي‌دليل نيست چرا كه افزايش واحدها پردازشي باعث افزايش قيمت مي‌شود از این رو اينتل تنها به بهينه‌سازي واحدهاي از پيش طراحي شده در معماري Core 2 بسنده كرده‌ است .
از تغييرات اعمال شده ميتوان به پشتيباني از تكنولوژي«هم جوشي Micro-OP» از دستورات 64 بيتي نام برد اين واحد در معماري Conroe تنها از دستورات 32 بيتي پشتيباني مي‌كرد. تكنولوژي «هم‌جوشي Micro-op» اولين بار در پردازنده‌هاي مبتني بر معماري Conroe كه در آن زمان واحد رمزگشايي دستورالعمل‌ها رادستخوش تحولات زيادي قرار داده بود مورد استفاده قرار داد، عمليات «Micro-op» به تبديل دستورالعمل‌هاي x86 به دستورالعمل‌هاي با طول ثابت الحاق مي‌شود كه توسط رمزگشاها صورت مي‌گيرد. نوآوري هم جوشي در عمليات micro-op پردازنده را قادر مي‌سازد تا با ادغام دو دستورالعمل‌ x86 وابسته به يكديگر به جاي تبديل به دو micro-op به يك micro-op تبديل كند كه در اينصورت هر پنج دستورالعمل در هر سيكل به چهار دستورالعمل تبديل مي‌شود.از ديگر تغييرات ايجاد شده در رمزگشايي دستورالعمل‌ها، واحد كشف جريان حلقه (Loop Stream Detector) است كه 3 تغيير اساسي داشته است:
1) توانايي ذخيره‌سازي از 18 micro-op به 28 Micro-op يعني هر بافر داده قادرست 28 دستورالعمل را در خود ذخيره كند.
2) تغيير مكان واحد كشف جريان (یا همان بافرهاي داده) در خط لوله به بعد از رمزگشاها كه باعث مي‌شود بخش وسيعي از خط لوله غيرفعال شود. (واحد كشف جريان تا پيش از اين در معماري Conroe بعد از مرحله واكشي دستورالعمل‌ها قرار داشت).
3) همانطور كه گفته شده توسط تكنولوژي «هم جوشي Micro-op» دو دستورالعمل وابسته به X86 به يك Micro-op تبديل مي‌شود لذا اينتل اينبار دستورالعمل‌هاي X86 را ذخيره نمي‌كند بلكهMicro-op ها را ذخيره مي‌كند كه موجب كاهش دستورالعمل‌ها مي‌شود و در نهايت موجب مي‌شود تا واحد كشف جريان حلقه افزايش كارآيي را به همراه داشته باشد.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

واحد كشف جريان حلقه ( Loop Stream Detector) ، يك حافظه‌ي نهان بسيار كوچك است كه با كوتاه كردن اولين مرحله خط لوله موجب غيرفعال شدن واحدهاي بي‌استفاده مي‌شود كه به طبع آن از مصرف توان و فشار روي حافظه نهان سطح يك كاسته مي‌شود.

street king
02-06-2009, 14:58
مصرف توان:

تا اينجای كار با معماري و طراحي پردازنده‌هاي Corei7 آشنا شديد، افزايش واحدها، افزايش دستورالعمل‌ها و سطوح حافظه نهان و ... همگي موجب افزايش توان خواهند شد لذا اين افزايش مصرف توان مهندسان اينتل را برآن داشته كه با استفاده از نوآوريهايي مصرف توان پردازنده را تحت كنترل خود در بياورند. همانطور كه در نمودار و جدول نتايج مشاهده مي‌كنيد پردازنده‌هاي Corei7 نسبت به پردازنده‌هاي Core 2 Quad از توان مصرفي كم‌تري استفاده مي‌كند .



[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

Turbo Boost :
اينتل با استفاده از يك میکرو كنترلر مجتمع شده در معماري Nehalem به صورت پيوسته بر توان مصرفي و درجه حرارت هر يك از هسته‌ها نظارت مي‌كند اين واحد كنترل توان كه با Turbo Boost از آن ياد مي‌شود قادر است تا توان هسته‌هايي كه در حالت بيكاري قرار دارند را تقريبا به صفر برساند. (اين كنترل مصرف توان بيش از اين در پردازنده‌هاي Agena شركت AMD به شكلي ديگر پياده‌سازي شده بود) البته بايد متذكر شويم كه دليل وجود جريان نشتي در ترانزيستورها هيچ گاه مصرف توان پردازنده حتي در حالت بيكاري به صفر نخواهد رسيد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

Turbo boost علاوه بركاهش مصرف توان قادر است در زمانيكه پردازنده در سطح پايين‌تر از استاندارد TDP خود عمل كند يعني پس از بكارگيري دو تكنولوژي Hyper Threadingو SMT باز نتوانست به حداكثر توان پردازشي خود برسد به صورت اتوماتيك فركانس پردازنده را به اندازه 133 يا 266 مگاهرتز بيشتر از فركانس عادي افزايش مي‌دهد. عكس اين قضيه نيز، توسط تكنولوژي قديمي Speed Step در مواقع بيكاري پردازنده رخ مي‌دهد بدين صورت كه ضريب پردازنده (multiplier) را تا 12 كاهش مي‌دهد تا فركانس به 6/1 گيگاهرتز (1600= 133× 12) كاهش پيدا ‌كند که در پي آن نيز ولتاژ پردازنده كاهش و به 137/1 مي‌رسد.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

در جدول زير مي‌توانيد تفاوت كارآيي پردازنده را در حالت فعال و غيرفعال بودن تكنولوژي Turbo boost مشاهده كنيد. همانطور كه ملاحظه مي‌كنيد تكنولوژي Turbo boost افزايش كارآيي را در تمامي برنامه‌ها به همراه داشته است كه البته اين افزايش كارآيي حداكثر به ميزان 8 درصد بوده است.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

Over Speed Protection تكنولوژيي ديگريست كه اينتل براي كنترل دما و مصرف توان از آن استفاده كرده است كه به موجب آن توان مصرفي هيچ يك از پردازنده‌هاي Corei7 نمي‌تواند فراتر از 130 وات باشد (البته در صورت فعال بودن اين تكنولوژي) پردازنده‌هاي Corei7 قابليت فعاليت دردماي نهايتا 100 درجه سانتيگراد را دارا مي‌باشند و در صورت افزايش دما بيش از 100 درجه پردازنده به صورت خودكار فركانس كاري و ولتاژ پردازنده را پايين مي‌آورد تا به پردازنده آسيبي نرسد. همچنين بايد يادآورد شوم كه تمامي 5 مدل معرفي شده داراي توان 130 وات مي‌باشند و از تكنولوژيهاي قبلي هم چون Thermal Monitor, C I E نيز بهره مي‌برند.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

با تغییر سوکت وسطح پردازنده خنک کننده استوک نیز دچار تغییر شده است.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 14:59
اوركلاكينگ:

هدف از اوركلاكينگ هميشه به افزايش كارآيي و يا ثبت ركود معطوف مي‌شود از اين رو اوركلاكينگ پردازنده‌هاي Core i7 نسبتاً متفاوت از پردازنده‌هاي Core 2 است. قابليت اوركلاكينگ پردازنده رابطه‌ي مستقيم با معماري پردازنده دارد، پس از ارائه پردازنده‌هاي بسيار موفق سري E8xxx (هسته‌هاي Wolfdale) دراوركلاكينگ انتظارمي‌رفت پردازنده‌هاي Core i7 نيز بتوانند بسيار عالي و حتي قوي تر از ظاهر شوند. اما از لحاظ قدرت اوركلاكينگ پردازنده‌هاي Core i7 نتوانستند اينگونه ظاهر شوند و تقريباً در سطحي برابر با هسته‌هاي Wolfdale عمل كردند.
اما در آن روي سكه اوركلاک پردازنده‌هاي Core i7 تأثير بسزايي در كارآيي آن‌ها دارد و همانطور كه در جدول زير مشاهده مي‌كنيد تنها با افزايش فركانس به ميزان 11درصد به طور ميانگين عملكرده پردازنده با 8درصد افزايش كارايي رو‌به رو شد.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

(با توجه به حذف رابط FSB و جايگزيني QPI اور كلاكينگ پردازنده‌هاي Core i7 مقداري متفاوت از پردازنده‌هاي قبلي شركت اينتل است كه به دليل گستردگی مطلب نمي‌توان به آموزش نحوه‌ي اوركلاكينگ این پردازنده ها بپردازيم، علاقه‌مندان به اين مبحث مي‌توانند از مقاله‌اي كه در اين زمينه تحت عنوان « انفجاري خفيف با Core i7 » بهره ببريد. ) منتشر شده است

street king
02-06-2009, 15:01
چيپستX58:

با انتقال كنترلر حافظه به درون پردازنده و جايگزيني رابط QPI به جاي FSB چيپست پل شمالي نيز بايد بالاجبار عوض مي‌شد، چيپست پل شمالي X58 تنها چيپستي است كه از پردازنده‌هاي Core i7 پشتيباني مي كند،‌چيپست پل جنوبي نيز ICH10R مي‌باشد كه از پيش از اين در مادربردهاي مبتني بر چيپست P45 عرضه شده بود.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

در پي برنامه‌ريزي شركت اينتل براي بركناري چيپست پل شمالي، X58 دستخوش اولين تغيير شد و با انتقال كنترلرحافظه به درون پردازنده بيشتر به يک مبدل رابط QPI به PCI EXPRESS تبديل شده است.
X58 قابليت پشتيباني از 4 كارت گرافيك (Muti Gpu) باپيكربندي (16x-16x) و(4x-4x-4x-4x) و يا (16x-16x-4x)‌ را دارد. اما نكته‌اي كه X58 را از ديگر چيپست‌ها متمايز مي‌سازد، قابليت پشتيباني از هر دو تكنولوژي 3-way SLI و Cross Fire-x دو شركت انديديا و AMD است (البته نه به صورت همزمان) كه مي تواند برای گيمر‌ها بسیار جذاب باشد.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:23
تست و بنچ ماركينگ:


حال پس از آشنايي كامل با پردازنده‌هاي Core i7 و معماري Nehalem بررسي كارآيي اين پردازنده‌ها كه مهم‌ترين مسئله مرتبط با اين نسل پردازنده‌هاست مي‌پردازيم.
در اين بررسي از آخرين پردازنده‌هاي چهارهسته‌اي دو شركت استفاده شده تا تفاوت بين آنها به خصوص تفاوت بين پردازنده‌هاي Core i7 و Phenom II شركت AMD به خوبي مشخص شود.
(همچنين بايد یاداور شوم بدليل گستردگي پردازنده‌ها و موجود نبودن تمامي اين مدل‌ها در لابراتور خانه سخت افزار موفق به بررسي كامل اين پردازنده‌ها نشديم لذا از نتايج بدست آمده از سايت معتبر Toms hardware استفاده كرده‌ايم.)


مشخصات سيستم تست:

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


در بخش نرم افزاری نیز از اخرین درایورها و نسخه های هر برنامه استفاده شده است.

street king
02-06-2009, 15:26
Sandra CPU and Multimedia:




[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:29
Sandra Memory And Everest :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:32
Everest And PCMark Vantage :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:36
PC Mark And 3DMark :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:37
Crysis, UT3, WiC, Supreme Commander :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:38
AVG, Winrar, WinZip, Acrobat :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:40
PhotoShop, iTunes, Lame, Studio 12 :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:42
DivX, Xvid, Mainconcept, Premiere :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:43
Blu-ray, Cinema 4D, 3D Studio Max, Fritz, Nero 8 :


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 15:50
آينده معماری Nehalem:


از قديم گفتن سالي كه نكوست از بهارش پيداست.
معماري Nehalem سرشار از نوآوري و نبوغ است و همانطور كه تا اينجا شاهد بوديد معماري Nehalem و پردازنده‌هاي Core i7 يك سر و گردن از تمامي پردازنده‌هاي دو شركت كه تا كنون ارائه شده‌اند بالاتر است، شايد تنها مشكل اين پردازنده را نبود پردازنده‌هاي مبتني بر معماري Nehalemبا قيمت‌هاي پايين‌تر از 300 دلار است كه اينتل هم براي بدست آوردن سطح متوسط بازار كه عمده‌ي كاربردن در آن قرار مـي‌گيرد پـردازنده‌هاي Core i5 با نام رمز Lynnfield همراه چيپست p55 و p53 را معرفي و تا چند ماه ديگر عرضه خواهد كرد و در صورتيكه AMD فكر چاره‌اي نينديشد باز مي‌توان سهم عمده‌اي از بازار را از آن اينتل دانست.
برنامه اعلام شده در سال 0052 تحت عنوان استراتژي تيك ـ تاك (Tick-Tock) مبني بر يك نوآوري در هر سال براي كاهش فناوري توليد پردازنده، معماري Nehalem با بروسه ساخت 32 نانومتري در اواخر سال 2009 و تحت عنوان Westmere ارائه مي‌شوند اين پردازنده‌هاي 32 نانومتري در دو دسته‌ي متفاوت عرضه ميشوند كه در دسته اول از 6 هسته و 12 Thread و دسته‌ي دوم پردازنده‌هايي هستند كه كنترلر كارت گرافيك نيز در آن جاي دارد و تنها از 2هسته بهره مي‌برند كه با اين اقدام اينتل،‌پل شمالي به طور كامل از ميان برداشته مي‌شود.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


اما پس از معماري Nehalem پردازنده‌هاي 32 نانومتري با گرافيك مجتمع تحت عنوان Sandy Bridge در سال 2010 عرضه مي‌شوند تا اينتل براي اولين بار توانسته باشد هر دو چيپست گرافيك و پردازنده (Cpu/Gpu) را تحت يك Package عرضه كند. (البته ايده Cpu/Gpu ابتدا توسط AMD مطرح شده اما با توجه به تعويق افتادن برنامه‌هاي زماني AMD كه ديگر يك موضوع عادي شده است با 2 سال تاخیر در سال 2012 اتفاق مي‌افتد.)

نتيجه‌گيري:


Core i7 بار ديگر توانست قدرت بي‌چون و چرا اينتل را به رخ همگان بكشد و با ارائه پردازنده Core i7 و چيپست X58، پلتفورم كامل و كارآمد را عرضه كند. همانطور كه مشاهده كرديد تمامي مدل‌هاي Core i7 توانستند از تمامي پردازنده‌ها قويتر ظاهر شده و به خصوص كه باز پردازنده‌هاي جديد Phenom II شركت AMD نيز به هيچ عنوان نتوانستند با اين پردازنده‌ها برابری داشته باشند براي مثال پردازنده Core i7 965 قويترين پردازنده اين مدل با. درصد تفاوت كارآيي نسبت به پردازنده 940 Phenom II توانست بسيار سريعتر ظاهر شود، اين درحاليست كه استفاده از پلنتفورم اينتل اين اجازه را نيز به كاربر مي‌دهد كه از هر دو تكنولوژي كراس فايرو 3-Way SLIبه سليقه‌ي خود بهره ببرد .
يك كاربرد باهوش ي‌تواند با خريد حداقل مدل 920 با قيمت 300 دلار پردازنده‌اي قويتر از پردازنده‌ي QX97JO با قيمت 1300 دلار داشته باشد.
شايد تنها شكوه‌اي كه مي‌توان نسبت به معماري Nehalem داشت عرضه پردازنده با سوكت و چيپست‌ها متفاوت دانست Core i5 Lga1156 )و Core i7 Lga1366 ) كه براي تعويض پردازنده كاربر را دچار مشكل مي‌كند.
در پايان مي‌توان به صراحت بيان كرد كه پردازنده‌هاي Core i7 بسيار قوي‌تر از پردازنده‌هاي Phenom II شركت AMD بوده و بايد اينتل را برنده‌ي اين ميدان دانست.

street king
02-06-2009, 15:52
انفجاري خفيف با Core i7:

مقدمه:


مطمئناً تاكنون صحبت‌ها و نوشته‌هاي بسياري در موارد مبحث اوركلاكينگ را در مجلات، سايت‌ها و يا هر كجاي ديگر شنيده و خوانده‌ايد و اگر خود تا به حال اوركلاكينگ را تجربه نكرده‌ايد حداقل با اين مبحث آشنايي داريد.
اوركلاكينگ پردازنده پرطرفدارترين جبهه‌ي اوركلاكينگ مي‌باشد چرا كه هم از لحاظ تأثير مستقيم بر روي كارآيي سيستم و هم‌چنين طالب مسائل فني و تجهيزات مورد نياز بسته به سطح اوركلاكينگ می باشد باعث شده تا توجه بيش‌تر اوركلاكرها را به خود معطوف كند.
در اين مقاله سعي كرده‌ايم بيش‌تر به یک تجربه ساده اوركلاكينگ بر روي سيستم تمركز كرده و با بيان نكات لازم در اوركلاكينگ اين نسل از پردازنده‌ها توانسته باشيم مطالب مفيدي را در اختيار شما دوستان قرار دهيم.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

Core i7 , X58


صحبت‌ها از معرفي معماري Nehalem شروع شد،‌ولتاژ كاري پايين، ضريب پردازنده بالا (20)، تكنولوژي QPI همه و همه نويد پردازنده‌هايي با قابليت اوركلاكينگ فوق‌العاده‌اي (حتي بالاتر از سري‌هاي E8000 ) را مي‌دادند، اما بالاخره پس از عرضه اين پردازنده‌هاو پس از بررسي‌هاي به عمل آمده هرچند Core i7 توانسته بود انقلابي را در عرصه پردازنده‌ها و هم‌چنين كارآيي شگرفي را به نمايش بگذارد اما قابليت اوركلاكينگ اين پردازنده‌ها اگر نگوييم كه نسبت به پردازنده‌هاي سري E8000 كم‌تر شده بود، اما افزايشي هم نداشته و شايد هم یکی از دلايل عرضه پردازنده E8700 با فركانس 3500 از سري پردازنده‌هاي دوست داشتني اينتل نيز براي جبران مافات و راضي نگه داشتن مشتاقان اوركلاك بود (مطمئن باشيد اوركلاكينگ به پردازنده E8700 بي‌نهايت لذت بخش خواهد بود)
Core i7 پردازنده‌اي چهار هسته‌اي (اين يكي واقعاً چهار هسته‌اي هست!) با 8Thread بوده و داراي 8 مگابايت حافظه نهان سطح 3 و بهره‌گيري از گذرگاه QPI به جاي رابطFSB و سوكت LGA 1366 گونه‌اي متفاوت از پردازنده‌ها را معرفي كرده است.


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


در اين سير تحولات چيپست پل شمالي نيز بايد تغيير مي‌كرد و چيپست x58 نيز با تغييراتي چشمگير نسبت به چيپست‌هاي قبلي براي پشتيباني از اين پردازنده‌ها به بازار معرفي شد.

street king
02-06-2009, 15:56
اوركلاكينگ:

ابتدا بايد قطعات مورد نياز را فراهم مي‌كرديم، همانطور كه در ابتدا گفته شد هدف اوركلاكي ساده بود پس به سراغ ساده‌ترين مدل اين پردازنده يعني Core i7 920 رفتيم، بعد از پردازنده نیز مهم‌ترين كامپونت مادربرد بوده كه به دليل نبود دو مادربرد Blood Rage شركت فاكسكان و Rampag II شركت ASUS به ناچار مادربرد ASUS P6t Delux را انتخاب كرده و با استفاده از حافظه‌هاي XMS3 1333 شركت Corsair و خنك كننده‌ي قوي Hyper Z-6,, شركت كوكر مستر كه از قبل در لابراتوار موجود بود استفاده كرديم؛ مشخصات مابقي كامپونت‌ها را مي‌توانيد در جدول زير ببينيد.


مشخصات سيستم اوركلاكينگ:

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 16:02
پس از اسمبل سيستم،ابتدا دماي قسمت‌هاي مختلف سيستم را اندازه‌گيري مي‌كنيم كه نتايج از اين قرار بود:
پل شمال: 49 درجه سانتیگراد
پل جنوبي: 52 درجه سانتیگراد
پردازنده: 26 درجه سانتیگراد
و نتايج بدست آمده را قبل از اوركلاكينگ نيز يادداشت مي‌كنيم كه نتايج بدست آمده نيز بدين شرح بود:

Super pi:
14.695

3D Mark Vantage:
9880


3D Mark 06:
14988

تنظيمات بايوس:
ابتدا قابليت‌هاي غيرضروري همانند 1394 , Lan, USB و ... را كه به آن‌ها نياز نداريم و هم‌چنين يكسري از امكانات پردازنده را در سربرگ CPU Confiquration غيرفعال مي‌كنيم، فناوري‌هاي چون TM Fanction ، CIE support , Execute Disable Bit و ... .

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

حال سربرگ Ai Tweaker كه تنظيمات اصلي مربوط به اوركلاكينگ قراردارد را باز مي‌كنيم؛
ابتدا بايد توجه داشته باشید كه فركانس پردازنده ضريبي است از: فركانس مرجع × ضريب پردازنده كه در اينجا فركانس مرجع با BCLK Frequency و ضريب پردازنده با CPU Ratio setting نمايش داده مي‌شود

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

ضريب پردازنده در Core i7 920 ثابت مي‌باشد، لذا تنها با افزايش فركانس پايه مي‌توانيم فركانس كاري پردازنده را افزايش دهيم؛ هم چنين بايد توجه داشته باشيد كه با تغيير اين پارامتر، سرعت QPI نيز افزايش پيدا خواهد كرد؛ البته اين در حالت Auto (خودكار) مي‌باشد و شما مي‌توانيد آن را از حالت Auto خارج كرده و آن را ثابت نگه داريد.
اين افزايش فركانس خودكار براي حافظه‌ها نيز وجود دارد كه كنترل اين پارامتر نيز مي‌تواند همانند كنترل فركانس QPI صورت گيرد كه در ادامه خواهيد ديد.
برای اينكه بحث را كوتاه كنيم تا از چارچوب حوصله شما هم خارج نشود ابتدا قصد داريم فركانس پردازنده را تا 4000 مگاهرتز افزايش دهيم بدين منظور ابتدا فركانس پايه را از 133 به 200 مگاهرتز افزايش مي‌دهيم (4000=x20×200) تا فركانس پردازنده 4000 به مگاهرتز افزايش پيدا كند، در اين حالت فركانس QPI نيز از 4.8 به 7.2 گيگا تكسل بر ثانيه افزايش پيدا مي‌كند كه بنا به تجربه‌ي قبلي اين افزايش فركانس QPI را مي‌توان با اعمال ولتاژ پايدار نگه داشت و لذا به همين خاطر آن را در حالت Auto قرار داده و تغييري در آن اعمال نمي‌كنيم.
همانطور كه گفته شد با افزايش فركانس پايه فركانس حافظه‌ها نيز افزايش پيدا مي‌كند و فركانس حافظه‌هاي ما نيز به 1600 مگاهرتز افزايش پيدا كرده است كه با توجه به نوع حافظه‌هاي موجود و هم‌چنين تجربه‌ي گذشته به ناچار فركانس حافظه‌ها را به 1200 مگاهرتز كاهش داديم اين مقدار حتي كم‌تر از فركانس پيش فرض حافظه‌هاست اما خوب چاره‌اي نيست!
حال مي‌ماند فركانس uncore كه اين فركانس هم همانند فركانس‌هاي QPI و حافظه‌ها وابسته به فركانس پايه بوده و در حالت خودكار با افزايش فركانس پايه، فركانس اين پارامتر هم افزايش پيدا مي‌كند كه البته ما اين قسمت را نيز همانند فركانس QPI در حالت Auto تنظيم مي‌كنيم.
البته اين نكته كه گفته مي‌شود فركانس uncore بايد 2 برابر فركانس حافظه‌ها باشد و يا با ضريب 1+x2 باشد طبق آزمايشات ما در مواقعي كه حافظه‌ها با فركانس پايين كار مي‌كنند زياد صادق نبوده و مي‌تواند بيش‌تر نيز باشد (البته تا حدي) كه ما نيز به همين خاطر فركانس Uncore را در حالت Auto باقي نگه داشتيم.
هم چنين بايد متذكر شوم كه مادربرد Asus P6T ضرايب مختلف را به شما نمايش نمي‌دهد و تنها فركانس‌هاي حاصل از ضريب مختلف را مي‌توانيد مشاهده كنيد به فرض مثال هنگاميكه ما فركانس حافظه را تا 1200 مگاهرتز كاهش داديم در اصل ضريب آن را به 6 كاهش داديم اما شما فقط فركانس 1200 مگاهرتز را مشاهده مي‌كنيد نه ضريب را.
سرانجام نوبت به اعمال ولتاژها مي‌رسد، به زبان ساده بايد قسمت‌هايي را كه در آن‌ها افزايش فركانس داشته‌ايم را بايد اعمال ولتاژ كنيم البته با كمي حساسيت در مقادير اعمالي كه ولتاژهاي اعمالي ما از اين قرار است:
CPU Voltage: 1.4 (V)
CPU PLL Voltage: 7.98 (V)
QPI/ DRAM Core Voltage: 1.55 (V)
IOH Voltage: 1.38 (V)
ICH Voltage: 1.40 (V)
هم چنين بايد خاطر نشان شوم هرچند اعمال ولتاژ بيش‌تر تا حدي باعث ثبات بيش‌تر در اوركلاك مي‌شود اما از طرف ديگر باعث افزايش حرارت درسطح بسيار بالايي مي‌شود كه می تواند باعث شكست در اوركلاكينگ شود چرا كه اوركلاكينگ را می توان به گونه‌اي نبرد بين حرارت و خنك كننده دانست، لذا هميشه سعي كنيد تا حد امكان از ولتاژهاي پايين‌تر استفاده كنيد.
حال پس از اعمال تنظيمات لازم، سيستم را بوت مي‌كنيم؛ پس از بالا آمدن سيستم عامل ابتدا دماها را چك مي‌كنيم و پس از اطمينان با استفاده از نرم‌افزار super pi Mod ثبات و عملكرد اوركلاكينگ را ازمايش مي‌كنيم كه همانگونه كه در تصوير مي‌بينيد سيستم به طور تقریبی با افزايش كارآيي 30 درصدی رو به رو شدو برای اینکه پایداری کامل سیستم را ازمایش کنیم از نرم افزار wpime بهره می گیریم که نتاج بدست امده نیز بدین شرح است:

Super pi:
10.358

3D Mark Vantage:
11670

3D Mark 06:
18425

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

حال با موفقیت در اجرای wprime پارا يك قدم فراتر مي‌گذاريم تا فركانس پردازنده را به 4200 مگاهرتز افزايش دهيم پس دو مرتبه به محيط بايوس باز مي‌گرديم.
اما فقط مقدار فركانس پايه را به 210 مگاهرتز افزايش مي‌دهيم و بدون هيچ گونه تغيير ديگري دو مرتبه سيستم را بوت كرده و ثبات و عملكرد سيستم را دو مرتبه چك مي‌كنيم.
همانگونه كه در تصوير مشاهده مي‌كنيد باز اوركلاكينگ پردازنده موفقيت آميز بود اما اين بار دما تا 50 درجه سانتيگراد افزايش يافت كه بيش‌تر از اين دما مي‌تواند باعث اخلال در عملكرد سيستم شود.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]


اما نكته‌اي كه در فركانس 4200 حائز اهميت بود عدم تغيير در مقادير ولتاژها بود لذا مي‌توان دريافت تا قبل از آنكه سيستم ناپايدار شود احتياجي به اعمال ولتاژ نداريم.

street king
02-06-2009, 16:04
اما در فركانس 4400 بدليل افزايش حرارت بيش از حد سيستم تقريباً ناپايدار بوده كه در ادامه برای كار دردمای زیر صفرناچاراً مجبور به استفاده از خنك كننده‌هاي دست ساز و نيتروژن مايع شديم كه بنا به هدف اين مقاله كه قصد ارائه نحوه‌اي ساده در اوركلاكينگ بود لذا تنها با درجه تصاوير ادامه‌ي اوركلاكينگ را شاهد باشيد.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

street king
02-06-2009, 16:06
نتيجه گيري:

همانطور كه مشاهده كرديد، اوركلاك پردازنده جداي از جذابيت كمك به سزايي در افزايش كارآيي و هم چنين صرفه جويي در مصرف هزينه مي‌كند. همانطور كه در جدول زير مشاهده مي‌كنيد دو مدل 920 و 940 هيچ گونه تفاوتي با يكديگر ندارند و تنها تفاوت آن در فركانس كاري 2 پردازنده مي‌باشد كه تنها 300 مگاهرتز بين اين دو اختلاف است. با اين تفاوت كه مدل 940 حداقل 200 هزار تومان گرانتر از مدل 920 مي‌باشد كه شما با خريد مدل پايين‌تر يعني مدل 920 مي‌توانيد با يك اوركلاك ساده اين تفاوت ناچيز را جبران كرده و در مصرف هزينه‌هاي خود نيز صرفه‌جويي كنيد.

[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]

اما در مورد قابليت اوركلاكينگ كامپونت‌هاي استفاده شده بايد گفت كه مادربرد Asus P6T هرچند به منظور اوركلاكينگ طراحي نشده است ولی درحد خود راضی کننده ظاهر شد اما در اين رنج قيمت مطمئناً گزينه‌هاي بهتري نيز براي اوركلاكينگ پيدا مي‌شود. در مورد اين نسل از پردازنده‌ها نيز بايد منتظر ماند تا هسته‌هاي ديگر نيز روانه بازار شوند تا بهتر بتوان نتيجه‌گيري نمود اما در طرف ديگر حافظه‌ها و خنك كننده نيز در نوع خود بسيار عالي عمل كردند.