مشاهده نسخه کامل
: بررسی کامل معماری Nehalem وپردازنده هایCore i7
street king
02-06-2009, 14:40
بررسی کامل معماری Nehalem وپردازنده هایCore i7
مقدمه
حال پس از گذشت چندماه از عرضه پردازندههاي Corei7 شايد در نگاه اول به تيتر مقاله كمي صحبت در مورد اين نسل از پردازندهها، چندان تازگي نداشته باشد، اما با توجه به هدف اين مقاله مبنی بر بررسي کامل معماري و كارآيي اين پردازندهها در مقابل پردازندههاي Phenom II شركت رغيب يعني AMD كه چندي پس از عرضه پرازندههاي Corei7 معرفي و عرضه شدند اين اجازه را به ما ميدهد كه در مورد سوال هميشگي اين كه كدام پردازنده بهتر است، تا حدي و به گونهاي كلي نيز اظهارنظر كنيم.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در ابتدا قصد داشتيم 2 مقاله در مورد مباحث تخصصي و جزئيات معماري Nehalem و كارآيي Corei 7 ارائه كنيم اما به دليل ارتباط مستقيم دو مبحث و درك بهتر مباحث در كنار هم پروندهاي هر چه كاملتر از اين پردازندهها را ارائه كنيم لذا سعي شده است تا حد امكان از زباني ساده و قابل فهم براي نگارش اين مطلب استفاده شود تا همهي خوانندگان محترم بتوانند استفادهاي مفيد از اين مبحث شيرين ببرند.
...و اما Core i7 :
در مورد موفقيت معماري Nehalem بدون شك تاكنون صحبتهايي شنيدهايد و ميتوان گفت هيچ ترديدي درموفقيت اين نسل از پردازندهها نيست اما ايده این معماري موفق از كجا سرچشمه گرفته است؟
از AMD اين شايد جواب بسياري از شما خوانندگان محترم و حتي تیتر چندي از سياستهاي معتبر جهاني باشد. انتقال كنترلر حافظه از پل شمالي به داخل پردازنده، حافظهي مشترك سطح L3 كه تاثير بسزايي در كارآيي و موفقيت اين پردازندهها بجا گذاشتهاند در ظاهر همه از تكنولوژيهاي AMD است ، براي صحت و يا عدم صحت اين عقيده اجازه بدهید به 8 سال قبل بازگرديم سال 2001 بود كه صحبتها در مورد ايده انتقال كنترلر حافظه به درون پردازنده از طرف AMD شروع شده بود كه در طرف مقابل اینتل همچنان به افزايش فركانس كاري معتقد بود و برآن پافشاري ميكرد و بالاخره AMD اين ايده را در سال 2003 در پردازندههاي 64 بيتي خود پياده كرد اما اين معماري خود تقليدي از پردازندههاي Power P4 شركت IBM بود و اساس ان متعلق به IBM بوده و هست و در طرف مقابل نيز اینتل بود که براي اولين بار در معماري NetBurst از حافظه نهان سطح 3 (L3) با ظرفيت 2 مگابايت در پردازنده های P4 Extreme استفاده كرد، پس ديگر نميتوان تهمت تقليد از AMD را به معماري Nehalem شركت اينتل زد، در ادامه متوجه ميشويد كه معماري Nehalem بيشتر الهام گرفته از پردازندههاي سرور ميباشد و اين سياستهاي زيركانه اینتل بوده است كه با تركيب عوامل كارآمد توانسته اين موفقيت چشمگير را رقم بزند.
خیلی از نظر کارکرد وسرعت جالب هستند ولی از نظر قیمت نه . . . !!!
street king
02-06-2009, 14:43
نگاهي اجمالي به پردازندههاي Corei7:
پردازندههاي Corei7 اولين نسل از پردازندههاي مبتني بر معماري Nehalem هستند و از 4 هسته با نام Bloomfield با پروسه ساخت 45 نانومتري واز سوکت LGA 1366بهره ميبرند (همچنين بايد متذكر شوم كه پيادهسازي هستههاي Corei7 به روش يكپارچ (monolithic) ميباشد) كه با استفاده از تكنولوژي Hyper Threading هر هسته قادر به پردازش دو عمليات به صورت همزمان مي باشد. (پردازنده های Corei7 توانایی پردازش 16 دستورالعمل را به صورت همزمان دارد).
با انتقال كنترلر حافظه به درون پردازنده ديگر FSB حذف و جاي خود را به رابط QPI (Quick Patch Interconnect) داده و فقط از حافظههاي DDR3 پشتيباني ميكند كه حافظهها را نيز ميتوان به صورت سه كاناله (Triple Channel) نيز پيادهسازي كرد.
پردازندههاي Corei7 داراي 3 سطح حافظه نهان Cache) L3, L2, L1) بوده كه مقدار هركدام به ترتيب 8MB, 2MB, 256KB ميباشد.
در اين نسل از پردازندهها سوكت پردازنده نيز از اين سير تحولات در امان نبوده و به LGA 1366 تغيير يافته و براي پشتيباني اين نسل از پردازندهها بايد از مادربردهاي مبتني بر چيست X58 (چيپست طراحي شده براي پردازندههاي Corei7) بهره برد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
پشتيباني ازهردو تكنولوژي 3-way 8LI, CrossFire-x ، دستورهاي SSE 4.2 ، تغیرات TLB و SMT و... ازديگر ويژگيهاي اين پردازندههاي قدرتمند است كه در ادامهي مقاله به تشريح كامل جزئيات هريك از اين فناوريها و مطالب بالا ميپردازيم.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 14:45
Core 2 VS Cori7 VS PhenomII
به دليل گستردگي مطالب فني هر نسل از پردازندهها در اين بخش از مقاله تنها به صورت اجمالي به بيان تفاوتهاي بين پردازندههاي Corei 7 با پردازندههاي Core 2, Phenom ميپردازيم كه درجدول زير ميتوانيد تمام جزئيات هر يك از معماريها را ببينيد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
حال با توجه به درك تفاوتهاي موجود بين نسلهاي مختلف پردازندهها يعني Core 2 نسل پيشين اينتل و فنوم شركت AMD توجه شمار را به نتايج تستهاي بدست آمده جلب ميكنم.
در جدول زیر اختلاف کارایی پردازنده Core i7 965 با دو پردازنده QX9770 و Phenom X4 9550 Black مشخص شده است.(برای مثال در تست Crysis پردازنده Phenom X4 33.7 درصد و پردازنده QX9770 از اینتل 12.1 درصد کندتر(slower) از Core i7 965 ظاهر شده اند.)
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
همانطور كه مشاهده ميكنيد پردازندههاي Corei7 برتري بسيار چشمگيري نسبت به ديگر پردازندهها داشتهاند.
پردازندههاي Corei7 داراي 5 مدل مختلف بودكه 3 مدل ابتدايي تا كنون به بازار عرضه شد و 2 مدل ديگر نيز تا چندي ديگر به بازار عرضه ميشوند.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
تفاوت کارایی پردازنده های Corei7 نسبت به یکدیگر را نیز می توانید در جدول زیر مشاهده کنید:
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
طبق رسم و رسوم شرکت اینتل اين بار نيز پردازندهها در 2 دستهي مختلف معمولي و Extreme عرضه شدهاند كه 975 و Corei7 965 تنها پردازنده های سري Extreme اين نسل می باشند كه با ضريب multiplier باز (unlock) بيشتر باب میل اوركلاکرها هستند.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 14:46
رابط QPI گذرگاهی برای عبور از محدودیت :
اين بار ديگر اينتل توانست از (FSB (Front Side Bus دل بكند و آنرا كنار بگذارد چرا كه اين رابط كند با مشكلات و معايبي كه داشت ديگر نميتوانست جوابگوي چنين معماري قوي باشد وباعث شد اينتل از گذرگاه جديدي با نام Quick Patch Interconnect) QPI ) در معماري Nehalem استفاده كند.
QPI براي ارتباط بين پردازنده و حافظهها و از دو مسير جداگانه جهت ارسال و دريافت داده استفاده ميكند.
ارتباط پردازنده- حافظه و پردازنده- IO با استفاده از اتصالات نقطه به نقطه پهناي باندي معادل 8/4 گيگاتكسل در ثانيه را در حالت يكطرفه ايجاد ميكند كه در حالت دو طرفه اين مقدار به 6/9 گيگاتكسل در ثانيه ميرسد اين نرخ انتقال براي پردازندههاي 920, 940 بوده و براي پردازنده i7 965 پهناي باندي معادل 4/6 گيگاتكسل در حالت يكطرفه و 8/12 گيگاتكسل در حالت 2 طرفه ايجاد ميكند.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
رابطه QPI در واقع يك رابط سريال به نام Common System Interface) CSI) با اتصال نقطه به نقطه است كه داراي دو مسير ارسال و دريافت به صورت مجزا ميباشد عرض هر يك از اين مسيرها 20 بیت بوده كه 16 بيت آن براي انتقال داده و 4 بيت آن نيز براي كدهاي كشف خطا استفاده ميشود.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
اگر مشخصات پردازنده QX 9770 (قويترين پردازنده Core 2 ها) را بخاطر داشته باشيد متوجه ميشويد كه پهناي باند i7 965 دقيقا برابر QX 9770 است حال اين سوال پيش ميآيد كه چرا Corei7 سريعتر است؟
همانطور كه گفته شد QPI داراي دو مسير مجزا براي خواندن و نوشتن است يعني 8/12 گيگاتكسل براي خواندن و 8/12 گيگاتكسل براي نوشتن در صورتيكه در پردازنده QX 9770 اين پهناي باند براي هر دو عمليات خواندن و نوشتن به صورت اشتراكي استفاده ميشود و از طرف ديگر در FSB دادههاي مربوط به هر دو بخش I/O وحافظهها بايد انتقال پيدا كند اما در مقابل يعني در QPI تنها دادههاي مربوط به I/O انتقال مييابد (در Corei7 ديگر دادهاي مربوط به حافظه انتقال نمييابد چرا كه كنترلر حافظه به درون پردازنده انتقال يافته است). بنابراين حجم تبادل اطلاعات در FSB بيشتر از QPI است كه باعث ميشود پهناي باند قابل دسترس Core i7 نسبت به Core 2 بيشتر شود. اينتل همچنين براي جبران پايين بودن نرخ انتقال اطلاعات در Core i7 نسبت به Core فركانس كاري را افزايش داده است. حال ديگر كاملا مطمئن ميتوانيد نتيجهگيري كنيد كه QPI بسيار سريعتر از FSB است.
street king
02-06-2009, 14:48
كنترلرحافظهمجتمع و یکپارچه :
شايد اقدام اينتل براي انتقال كنترلر حافظه از چيپست به درون پردازنده كمي دیر انجام شد اما بسيار كاملتر و مفيدتر از كنترلر حافظهي پردازندههاي AMD ظاهر شده است كنترل كننده داخلي پردازندههاي Corei 7 قابليت دسترسي به 3 ماژول حافظه از نوع DDR3 را به صورت همزمان و موازي (3 كاناله- Triple Channel) سرعتی معادل 25.4 Gb/s برای انتقال اطلاعات فراهم ميكند كه در مجموع پردازنده در هر سيكل به 192 (64×3) بيت دسترسي خواهد داشت در صورتيكه در پردازندههاي مبتني بر معماري K10 شركت AMD اين رقم 128 (64×2) بيت بوده كه تنها از حافظههاي DDR2 نيز پشتيباني ميكردند (البته در پردازندههاي Phenom IIAMD با سوكت AM3 و پلتفورم Dragon قابليت پشتيباني از حافظههاي DPR3 فراهم شده است).
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
كنترلر حافظه پردازندههاي Corei7 توانسته به خوبي پهناي باند را نسبت به Core2 تا دو برابر افزايش (حداكثر 32 گيگابايت در ثانيه) و زمانهاي تاخير دسترسي به حافظه را كاهش دهد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
همچنين بنابر اعلام شركت اينتل در حالت تئوري استفاده از حالت 3 كاناله، پهناي باند را در مقايسه با حالت 2 كاناله تا 50 درصد افزايش ميدهد. فركانس پايه پردازندههاي Corei7 برابر 133 مگاهرتز است كه در مدلهاي 940, 920 با ضرايب 6 و8 تنها از حافظههاي DDR3- 1066- DDR3- 800 ميكند اما در پردازنده i7 695 با توجه به پشتيباني از ضرايب 10 و12 ميتوان از حافظههاي بافركانس 1600 , 1333 نيز بهره برد (در مدلهاي Core 2 QX 9770 قابليت پشتيباني از حافظههاي با فركانس 1600 را دارا ميباشد. نيز تنها پردازنده
استفاده از حالت 3 كاناله ازديگر ويژگيهاي جديدي بود كه اينتل بر روي آن مانور تبليغاتي ميداد كه طبق اعلام شركت اينتل استفاده از حالت 3 كاناله، در حالت تئوري پهناي باند را تا 50 درصد نسبت به حالت 2 كاناله (Duall Channell) افزايش ميدهد حال اگر به نتايج بدست آمده توجه كنيد متوجه ميشويد كه تفاوت بسياركمي (کمتر از ا درصد) بين حالت 2 كاناله و 3 كاناله وجود دارد و درحال حاضر استفاده از حالت 3 كاناله اصلا به صرفه نيست.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 14:49
حافظه نهان 3 سطحی ایده ای قدیمی:
معماري Nehalem حافظه نهان پردازندههاي Corei 7 را نسبت به پردازندههاي قبلي شركت اينتل دستخوش تحولات بسياري كرد اينتل براي اولين بار در پردازندههاي چهارهستهاي خود از 3 سطح حافظه نهان (Cache) استفاده كرد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
حافظه كش سطح L1 تنها حافظه نهاني بود كه تغييري پيدا نكرد و همانند قبل از 64 كيلوبايت حافظه نهان براي هر هسته استفاده شد كه 32 كيلوبايت آن براي دادهها و 32 كيلوبايت ديگر براي كدها (دستورالعملها) اختصاص دارد و در مجموع 256 كيلوبايت كش سطح L1 را تشكيل ميدهند .تنها تغییر بوجود امده در حافظه نهان سطح L1افزایش زمان تاخیر از 3 سیکل به 4 سیکل است.
اما كش سطح L2 تغييرات مثل همیشه تغییرات زيادي پيداكرده است، پردازندههاي قبلي با هستههاي PenrynConroe و چهار هستهايهاي kentsfield, yorksfield از حافظه نهان سطح L2 به صورت اشتراكي با حجم بالا (2و3و6و8و12 مگابايت) بهره ميبردند اما اين بار تنها يك مگابايت فضا به حافظه نهان سطح L2 اختصاص داده شده است كه براي هر هسته 256 كيلوبايت به صورت اختصاصي در نظر گرفته شده است اما اينتل براي جبران كاهش حجم کاشه سطح L2 و بهبود عملكرد و كارايي با كاهش سيكلهاي تغيير از 15 سيكل به 10 سيكل زمانهاي تاخير را كاهش داده و سرعت دسترسي به دادهها را افزايش داده است (حافظه نهان L2 در پردازندههاي فنوم نيز به صورت اختصاصي است) .
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
از دیگر تغیراتی که در حافظه نهان سطح 1و2 ایجاد شد استفاده از 8 ترانزیستور بجای 6 ترانزیستور درمعماری core بدلیل تغییر ارایش جدید حافظه نهان صورت گرفت .
سیر تحولات حافظه L2 از ابتدا تا کنون را در نمودار زیر می توانید مشاهده کنید.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
و اما حافظه نهان سطح L3 كه تاثير بسزايي در افزايش كارآيي پردازنده دارد و به عقيدهي بسياري در نگاه اول تقليد از پردازندههاي فنوم شركت AMD است، همانطور که در ابتدا گفته شد استفاده از 3 سطح حافظه نهان اولین بار توسط اینتل صورت گرفت در ادامه نیز متوجه خواهيد شد كه تفاوت بسياري بين معماري دو شركت در طراحي كاشه سطح L3 وجود دارد.
در معماري Nehalem هر هسته براي دسترسي به يك داده اگر دادهي مورد نظر در حافظه نهان L3 وجود نداشته باشد پردازنده با اطلاع از موجود نبودن داده، ديگر به جستجوي داده در هستههاي ديگر درگير نميشود كه باعث ميشود زمان تاخير در دسترسي به اطلاعات كاهش يابد و در صورتيكه داده مربوطه در حافظه نهان سطح L3 وجود داشته باشد ميتوانيد از چهارمسير مجزا (هر هسته 1 مسير) به دادهها دسترسي پيدا كند كه باعث كاهش حجم مبادلات بين هستهها ميشود و همچنين از وابستگي حافظههاي نهان اختصاصي هرهسته به حافظهي اختصاصي هستههاي ديگر كاسته ميشود.
از ديگر ويژگيهاي طراحي حافظه نهان در Corei7 امكان دسترسي همزمان هر چهارهسته به دادههاي موجود در سطح L3 است كه باعث ميشود پردازنده در پردازشهاي چند رشتهاي و multi tasking سريعتر عمل كند همچنين بنابر اعلام شركت اينتل سرعت تبادل دادهها بين هستههاي مختلف نسبت به پردازندههاي Core 2 نيز افزايش يافته است. اما در طراحي حافظه نهان پردازندههاي اينتل همچنان مشكلاتي وجود دارد، پهناي باند حافظه نهان سطح L2 براي اجراي دستورالعملها همانند پردازندههاي قبلي همچنان برابر 16 بايت در هر سيكل است (درپردازندههاي فنوم برابر 32 بايت در ثانيه) و از آنجا كه پردازندههاي مبتني بر معماري Nehalem داراي 1 كد گشاي بيشتر نسبت به پردازندههاي فنوم هستند باعث شده فشار بيشتري روي حافظه نهان سطح L2L1 نسبت به قبل از 3 به 4 افزايش يافته و موجب ميشود سرعت حافظه نهان سطح L1 را بيش از پيش كاهش دهد. مشكل ديگري در حافظه نهان وجود دارد و بين هر دو پردازندههاي اينتل و AMD نيز مشترك است اين است كه هر حافظه نهان به طور مستقل داده و دستورالعمل را در خود ذخيره ميكند كه باعث ميشود فضاي حافظه نهان با دادههايي موجود در سطوح ديگر حافظه نهان از بين برود. وارد شود كه در صورت اجراي دستورالعملهاي 64 بيتي اين مشكل بيش از پيش نمايان ميشود اما مشكل به همين جا ختم نميشود، زمان تاخير نيز در حافظه سطح
اما در كل حافظه نهان اشتراكي سطح L3 اينتل با 8 مگابايت فضاي در دسترس كمك عمدهاي به بهبود كارايي پردازندههاي Corei7 در پردازشهاي سنگين و به خصوص نرمافزارهاي تك رشتهاي كرده است.
سیر تحولات مجموع حافظه L2+L2 از ابتدا تا کنون را نیز در نمودار زیر مشخص شده است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 14:51
Hyper Threading راهكاري از گذشته:
اینتل تكنولوژي Hyper Threading (چند بندي) را ابتدا در سال 2003 در پردازندههاي (Pentium D, Pentium 4 (NetBurst معرفي كرد كه در آن زمان بدليل عدم سازگاري نرمافزارها با اين تكنولوژي و هم چنين مشكلات موجود در معماري كه گاه مصرف توان را نيز تا حد نسبت زيادي بالا مي برد نتوانست موفق ظاهر شود و پس از آن اينتل را كنارگذاشت و اين بار دو مرتبه در پردازندههاي Corei7 استفاده كرده است.
به زبان ساده تكنولوژي Hyper Threading را اينگونه ميتوان تشريح كرد كه اين تكنولوژي هر هسته را قادر ميسازد كه دو كد مستقل (Thread) را به طور همزمان اجرا كند هر هسته پردازندههاي مبتني بر اين معماري در اصل شامل دو هسته منطقي ميباشد كه هركدام حالت كاري مخصوص به خود را دارا ميباشند در اين صورت سيستم عامل ميتواند هر هسته پردازنده را به عنوان دو هسته بشناسد، شما با بازكردن پنجره Task Manager در سيستم عامل ميبينيد كه سيستم عامل پردازنده Corei7 را با 8 هسته ميشناسد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
اما چرا Hyper Threading:
درطراحي پردازندهها، واحدهاي اجرايي از مهمترين قسمتهاي پردازنده ميباشد كه ميتواند تاثير بسزايي در كليه بخشهاي پردازنده داشته باشد اما اين واحدهاي اجراي هر چه بهتر بتوانند تغذيه شوند ميتوانند عملكرد بهتري داشته باشند، اجراي چندين كد مستقل (Thread) به صورت همزمان بهترين روش براي تغذيه مناسب واحدهاي اجرايست چرا كه در اين روش تعداد ترانزيستورها و اندازه هسته به اندازه كمي افزايش پيدا ميكند اين روش (Hyper Threading) ميتوان بهرهگيري از يك واحد اجرايي هر هسته را به ميزان 2 برابر افزايش داد اين كار تنها با ارسال 2 كد مستقل (Thread) از دستورالعملها به صورت همزمان به هر يك از هستههاي پردازنده و بدون نياز به افزايش واحدهاي اجرايي قابل اجرا است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
بهرهگيري از تكنولوژي Hyper Threading در معماري Nehalem همانطوركه در نتايج زير ميبينيد گاه تا 35 درصد باعث افزايش كارآيي شده است (اين رقم در پنتيومها تنها 4 تا 5 درصد بود) البته در مواردي نيز كه نرمافزارها قادر به تشخيص اين معماري نيستند باعث كاهش كارآيي شده است كه كاربر با درك اين مطلب ميتواند با فعال كردن به موقع اين تكنولوژي استفادهاي مطلوب از آن ببرد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در ادامهي مقاله در بخش SMT دليل اين افت كارآيي را به صورت كامل توضيح خواهيم داد.
street king
02-06-2009, 14:52
دستورات SSE 4.2 کامل تر از همیشه :
مجموعه دستورات Streaming SIMD Extensions) SSE) ابتدا در سال 1999 توسط اينتل معرفي شد. دستورالعملهاي SSE 4 شامل 54 دستورالعمل جديد است كه با توليد پردازندههاي 45 نانومتري متولد شدند كه 47 دستورالعمل آن در پردازندههاي 45 نانومتري با معماري Penryn تحت عنوان SSE 4.1 ارائه شدند و 7 دستورالعمل باقي مانده در پردازندههاي مبتني بر معماري Nehalem عرضه شدند كه زير مجموعه دستورات SSE 4.2 ناميده ميشدند (SSE 4.2 از تمامي 47 دستورالعمل SSE 4.1 هم پشتيباني ميكند).
هدف از ارائه دستورالعملهاي SSE4 افزایش Performance در برنامه های چند رسانه ای ، imaging ، و برنامه های کار با object های 3 بعدی هست . این دستورات باع افزایش کارایی کامپایلر های برداری و همچنین شامل پک هایی از دستورالعمل هایی هست که افزایش محاسبات Dword یا همان Text Processing را در بر دارد .
این دستورالعمل ها همچنین عملیاتی رو میسر می سازند که طی آن توان عملیاتی Memory در زمانی که اطلاعات از uncacheable WC memory خوانده میشوند افزایش پیدا میکند .
كه در زير ميتوانيد مجموعه دستورالعملهاي SSE 4.2 , SSE 4.1 رامشاهده كنيد:
مجموعه دستورالعمل های SSE 4.1
• دستورالعمل که نقش ضرب کننده های پک dword رو ایفا می کنند .
• دستورالعمل که تولید نقطه ای داده های floating-point همراه با گزینش خروجی و ورودی داده ها رو بر عهده دارند .
• دستورالعمل که وظیفه بارگذاری به همرا یک streaming hint رو در بردارد
•دستورالعمل که ساده سازی دادهای blend را بر عهده دارد .
•8 دستورالعمل که پشتیبانی از حداقل و حداکثر اعداد صحیح را توسعه می دهد
• دستورالعمل که گرد کردن داده های floating-point به همراه روش گرد کردن انتخابی و دقت لغو کردن استثناء ها را پشتیبانی می کند .
• دستورالعمل که ورود داده ها و استخراج آن ها را از رجیستر های XMM بهبود می بخشد.
• دستورالعمل که باعث بهبود تبدیل داده های عدد صحیح می شوند ( علامت و پسوند های مبدآ (
• دستورالعمل که باعث بهبود SAD (sum absolute difference)i جهت کوچک تر شدن بلوک ها میشود
• دستورالعمل که به جست و جوی عملیات افقی کمک میکند .
• دستورالعمل که مقایسه های ماسک شده رو بهبود می بخشد .
• دستورالعمل که باعث اضافه شدن بسته های ، برابری مقایسه های ، داده های qword میشوند .
• دستورالعمل که باعث اضافه شدن بسته های Dword به همراه اشباع شدن بی علامت میشود .
مجموعه 7 دستورالعمل SSE 4.2
• رشته سازی و محاسبات واژه که میتواند با استفاده از یک دستور ، دستور العمل های چندگانه را برنامه ریزی کند .
• دستورالعمل های Application-targeted accelerator (ATA)i
• دستورالعمل SIMD (Single Instruction, Multiple Data)i که افزایش ظرفیت 128bit ی اعداد صحیح SIMD در SSE4.1 می شود
5 مورد از مجموعه دستورالعملهاي اضافه شده در پردازندههاي Corei7 كه تحت عنوان SSE 4.2 از آن يادكرديم باعث افزايش سرعت پردازش فايلهاي XML و دستورالعمل ديگر در تشخيص صدا و DNA ميتواند موثر واقع شود وآخرين دستورالعمل اين مجموعه (CRC32) نيز براي شتابدهي در محاسبات كدهاي تشخيص خطا استفاده ميشود.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
(پردازندههاي Corei7 همچنين از تمامي دستورات EM64, MMX, SSE3, SSE2, SSE نيز پشتيباني ميكند).
street king
02-06-2009, 14:53
SMT:
معماري Nehalem توانست انقلابي را در عرصه معماري پردازندهها بوجود آورد اينتل در تمامي قسمتهاي ساختاري و زيربخش نيز تحولات بسياري ايجاد كرد واحد SMT نيز از اين قاعده مستثني نيست.
درمعماري Nehalem با توجه به افزايش دستورالعملهاي اجرايي و با توجه به اينكه نحوهي كاركرد SMT كه هميشه بار بيشتري را روي موتوراجرايي و آن هم خارج از ترتيب اعمال ميكند اينتل براي جلوگيري از كندشدن ورودي بافرها، بافرهاي Reorder (بافرهايي هستند كه دادههاي مربوط به دستورالعملهاي از پيش اجرا شده را در خود ذخيره ميكند) را به 128 ثبات افزايش داده اين در حاليست كه در معماري قبل Core 2 اين رقم 96 ثبات بوده است. اما در عمل، بافرهاي Reorder تقسيمبندي ميشوند تا هركدام از كدهاي مستقل (Thread) تنها به يك بخش از بافر دسترسي داشته باشند و نتواند همهي منابع را در اختيار خود نگه دارند. حال با SMTHyper Threading چند مورد كاهش كارآيي را به خاطر داشته باشيد، اين كاهش كارآيي تنها در نرمافزارهايي رخ ميدهد كه با تكنولوژي Hyper Threading به گونهاي مشكل دارند (البته اين مشكل بيشتر پيش پاي برنامهنويسان است). اندازهي هر يك از اين بخشها تنها به 64 ثبات پيدا ميكنند ولي در صورتيكه حتي يك كد مستقل به
صورت فردي اجراء شود، ميتواند به همه ثباتها دسترسي پيدا كند كه باعث كاهش كارآيي ميشود،
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در بخش Unified Reservation Station ( ایستگاه یکپارچه رزرواسیون بخشي كه با شناسايي دستورالعملهاي مختلف دستورالعملها را بخشهاي اجرايي متفاوت ارسال ميكند) نيز اينتل اندازهي بافرها را از 32 ثبات به 36 ثبات افزايش داده است، اما در اين بخش پردازنده در موارد خاص با افت كارآيي روبهرو نميشود چرا كه تقسيمبندي ديناميكي ثباتها اين اجازه را به Thread هاي مختلف ميدهد كه بسته به دستورالعمل خود به صورت هوشمند از ثباتها استفاده كنند. (ایستگاه رزرواسیون تنها بخشي است كه قابليت تقسيمبندي دنياميكي را دارد). همچنين اندازهي بافر بارگذاري و ذخيرهسازي نيز از 32 ثبات به 48 ثبات برای واحد بارگذاري و از 16 ثبات به 32 ثبات برای واحد ذخيرهسازي افزايش پيدا كرده است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
با تمامي اين تفاسير SMT بيشتر مواقع تاثير مثبت بركارآيي پردازنده و به خصوص در نرمافزارهاي كاربردي داشته است.
street king
02-06-2009, 14:54
TLB :
اين بخش نيز همانند بخشهاي قبلي (SMT) تغييرات زيادي داشته است (و حتي بيشتر) در اين بخش نيز ابتدا مفهوم و وظيفه TLB را بيان ميكنيم.
Translation Lookside Buffe) TLB) در اصل يك حافظه نهان بسیار کوچک است(Cache) كه به منظور جلوگيري از افت سرعت پردازنده در دسترسي به حافظه طراحي شده ، اين حافظه نهان كوچك براي اين كار اندكي از آخرين آدرسهايي كه به حافظه دسترسي داشتهاند را در خود ذخيره ميكند.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
TLB نيز همانند SMT بدليل افزايش دستورالعملها و همچنين افزايش سطوح حافظه نهان ميبايست دستخوش تحولات زيادي قرار ميگرفت.
معماري Nehalem برخلاف معماري Core 2 يك TLB دو سطحي واقعي بهره ميبرد (چيزي كه تا قبل از اين تنها در پردازندههاي سرور ميديديم).
TLB سطح يك بين دادهها و دستورالعملها به اشتراك گذاشته شده است كه توانايي ذخيرهسازي دادهها با 32 ثبات براي صفحات بزرگ و 64 ثبات براي صفحات كوچك را دارد اين درحاليست كه در معماري Core تنها 16 ثبات براي هر دو صفحات كوچك و بزرگ در نظرگرفته شده بود و همچنين براي ذخيرهسازي دستورالعملها نيز از 7 ثبات براي صفحات كوچك و 128 ثبات براي صفحات بزرگ بهره ميبرد.
در معماري Nehalem ، TLB سطح دو كمي با سطح يك متفاوت است در TLB سطح دو ذخيرهسازي دادهها و دستورالعملها (كدها) به صورت مشترك است و اعضا فقط براي صفحات كوچك در نظر گرفته شده است و تا 512 ثبات را نيز ميتواند در خود ذخيره كند، تغييرات اعمال شده در TLB موجب افزايش كارآيي پردازندهها در برنامههاي كاربردي شده است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 14:56
رمزگشايي دستورالعملها:
تا به اين جاي كار در اكثر واحدها شاهد تغيير و تحولات زيادي بودهايد اما واحد رمزگشايي دستوراالعملها نسبت به معماري Core 2 تغييرات چنداني نداشته است و فقط جزئيات اين واحد دچار پيشرفت شده است، اما اين عدم تحول نيز بيدليل نيست چرا كه افزايش واحدها پردازشي باعث افزايش قيمت ميشود از این رو اينتل تنها به بهينهسازي واحدهاي از پيش طراحي شده در معماري Core 2 بسنده كرده است .
از تغييرات اعمال شده ميتوان به پشتيباني از تكنولوژي«هم جوشي Micro-OP» از دستورات 64 بيتي نام برد اين واحد در معماري Conroe تنها از دستورات 32 بيتي پشتيباني ميكرد. تكنولوژي «همجوشي Micro-op» اولين بار در پردازندههاي مبتني بر معماري Conroe كه در آن زمان واحد رمزگشايي دستورالعملها رادستخوش تحولات زيادي قرار داده بود مورد استفاده قرار داد، عمليات «Micro-op» به تبديل دستورالعملهاي x86 به دستورالعملهاي با طول ثابت الحاق ميشود كه توسط رمزگشاها صورت ميگيرد. نوآوري هم جوشي در عمليات micro-op پردازنده را قادر ميسازد تا با ادغام دو دستورالعمل x86 وابسته به يكديگر به جاي تبديل به دو micro-op به يك micro-op تبديل كند كه در اينصورت هر پنج دستورالعمل در هر سيكل به چهار دستورالعمل تبديل ميشود.از ديگر تغييرات ايجاد شده در رمزگشايي دستورالعملها، واحد كشف جريان حلقه (Loop Stream Detector) است كه 3 تغيير اساسي داشته است:
1) توانايي ذخيرهسازي از 18 micro-op به 28 Micro-op يعني هر بافر داده قادرست 28 دستورالعمل را در خود ذخيره كند.
2) تغيير مكان واحد كشف جريان (یا همان بافرهاي داده) در خط لوله به بعد از رمزگشاها كه باعث ميشود بخش وسيعي از خط لوله غيرفعال شود. (واحد كشف جريان تا پيش از اين در معماري Conroe بعد از مرحله واكشي دستورالعملها قرار داشت).
3) همانطور كه گفته شده توسط تكنولوژي «هم جوشي Micro-op» دو دستورالعمل وابسته به X86 به يك Micro-op تبديل ميشود لذا اينتل اينبار دستورالعملهاي X86 را ذخيره نميكند بلكهMicro-op ها را ذخيره ميكند كه موجب كاهش دستورالعملها ميشود و در نهايت موجب ميشود تا واحد كشف جريان حلقه افزايش كارآيي را به همراه داشته باشد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
واحد كشف جريان حلقه ( Loop Stream Detector) ، يك حافظهي نهان بسيار كوچك است كه با كوتاه كردن اولين مرحله خط لوله موجب غيرفعال شدن واحدهاي بياستفاده ميشود كه به طبع آن از مصرف توان و فشار روي حافظه نهان سطح يك كاسته ميشود.
street king
02-06-2009, 14:58
مصرف توان:
تا اينجای كار با معماري و طراحي پردازندههاي Corei7 آشنا شديد، افزايش واحدها، افزايش دستورالعملها و سطوح حافظه نهان و ... همگي موجب افزايش توان خواهند شد لذا اين افزايش مصرف توان مهندسان اينتل را برآن داشته كه با استفاده از نوآوريهايي مصرف توان پردازنده را تحت كنترل خود در بياورند. همانطور كه در نمودار و جدول نتايج مشاهده ميكنيد پردازندههاي Corei7 نسبت به پردازندههاي Core 2 Quad از توان مصرفي كمتري استفاده ميكند .
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
Turbo Boost :
اينتل با استفاده از يك میکرو كنترلر مجتمع شده در معماري Nehalem به صورت پيوسته بر توان مصرفي و درجه حرارت هر يك از هستهها نظارت ميكند اين واحد كنترل توان كه با Turbo Boost از آن ياد ميشود قادر است تا توان هستههايي كه در حالت بيكاري قرار دارند را تقريبا به صفر برساند. (اين كنترل مصرف توان بيش از اين در پردازندههاي Agena شركت AMD به شكلي ديگر پيادهسازي شده بود) البته بايد متذكر شويم كه دليل وجود جريان نشتي در ترانزيستورها هيچ گاه مصرف توان پردازنده حتي در حالت بيكاري به صفر نخواهد رسيد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
Turbo boost علاوه بركاهش مصرف توان قادر است در زمانيكه پردازنده در سطح پايينتر از استاندارد TDP خود عمل كند يعني پس از بكارگيري دو تكنولوژي Hyper Threadingو SMT باز نتوانست به حداكثر توان پردازشي خود برسد به صورت اتوماتيك فركانس پردازنده را به اندازه 133 يا 266 مگاهرتز بيشتر از فركانس عادي افزايش ميدهد. عكس اين قضيه نيز، توسط تكنولوژي قديمي Speed Step در مواقع بيكاري پردازنده رخ ميدهد بدين صورت كه ضريب پردازنده (multiplier) را تا 12 كاهش ميدهد تا فركانس به 6/1 گيگاهرتز (1600= 133× 12) كاهش پيدا كند که در پي آن نيز ولتاژ پردازنده كاهش و به 137/1 ميرسد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در جدول زير ميتوانيد تفاوت كارآيي پردازنده را در حالت فعال و غيرفعال بودن تكنولوژي Turbo boost مشاهده كنيد. همانطور كه ملاحظه ميكنيد تكنولوژي Turbo boost افزايش كارآيي را در تمامي برنامهها به همراه داشته است كه البته اين افزايش كارآيي حداكثر به ميزان 8 درصد بوده است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
Over Speed Protection تكنولوژيي ديگريست كه اينتل براي كنترل دما و مصرف توان از آن استفاده كرده است كه به موجب آن توان مصرفي هيچ يك از پردازندههاي Corei7 نميتواند فراتر از 130 وات باشد (البته در صورت فعال بودن اين تكنولوژي) پردازندههاي Corei7 قابليت فعاليت دردماي نهايتا 100 درجه سانتيگراد را دارا ميباشند و در صورت افزايش دما بيش از 100 درجه پردازنده به صورت خودكار فركانس كاري و ولتاژ پردازنده را پايين ميآورد تا به پردازنده آسيبي نرسد. همچنين بايد يادآورد شوم كه تمامي 5 مدل معرفي شده داراي توان 130 وات ميباشند و از تكنولوژيهاي قبلي هم چون Thermal Monitor, C I E نيز بهره ميبرند.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
با تغییر سوکت وسطح پردازنده خنک کننده استوک نیز دچار تغییر شده است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 14:59
اوركلاكينگ:
هدف از اوركلاكينگ هميشه به افزايش كارآيي و يا ثبت ركود معطوف ميشود از اين رو اوركلاكينگ پردازندههاي Core i7 نسبتاً متفاوت از پردازندههاي Core 2 است. قابليت اوركلاكينگ پردازنده رابطهي مستقيم با معماري پردازنده دارد، پس از ارائه پردازندههاي بسيار موفق سري E8xxx (هستههاي Wolfdale) دراوركلاكينگ انتظارميرفت پردازندههاي Core i7 نيز بتوانند بسيار عالي و حتي قوي تر از ظاهر شوند. اما از لحاظ قدرت اوركلاكينگ پردازندههاي Core i7 نتوانستند اينگونه ظاهر شوند و تقريباً در سطحي برابر با هستههاي Wolfdale عمل كردند.
اما در آن روي سكه اوركلاک پردازندههاي Core i7 تأثير بسزايي در كارآيي آنها دارد و همانطور كه در جدول زير مشاهده ميكنيد تنها با افزايش فركانس به ميزان 11درصد به طور ميانگين عملكرده پردازنده با 8درصد افزايش كارايي روبه رو شد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
(با توجه به حذف رابط FSB و جايگزيني QPI اور كلاكينگ پردازندههاي Core i7 مقداري متفاوت از پردازندههاي قبلي شركت اينتل است كه به دليل گستردگی مطلب نميتوان به آموزش نحوهي اوركلاكينگ این پردازنده ها بپردازيم، علاقهمندان به اين مبحث ميتوانند از مقالهاي كه در اين زمينه تحت عنوان « انفجاري خفيف با Core i7 » بهره ببريد. ) منتشر شده است
street king
02-06-2009, 15:01
چيپستX58:
با انتقال كنترلر حافظه به درون پردازنده و جايگزيني رابط QPI به جاي FSB چيپست پل شمالي نيز بايد بالاجبار عوض ميشد، چيپست پل شمالي X58 تنها چيپستي است كه از پردازندههاي Core i7 پشتيباني مي كند،چيپست پل جنوبي نيز ICH10R ميباشد كه از پيش از اين در مادربردهاي مبتني بر چيپست P45 عرضه شده بود.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در پي برنامهريزي شركت اينتل براي بركناري چيپست پل شمالي، X58 دستخوش اولين تغيير شد و با انتقال كنترلرحافظه به درون پردازنده بيشتر به يک مبدل رابط QPI به PCI EXPRESS تبديل شده است.
X58 قابليت پشتيباني از 4 كارت گرافيك (Muti Gpu) باپيكربندي (16x-16x) و(4x-4x-4x-4x) و يا (16x-16x-4x) را دارد. اما نكتهاي كه X58 را از ديگر چيپستها متمايز ميسازد، قابليت پشتيباني از هر دو تكنولوژي 3-way SLI و Cross Fire-x دو شركت انديديا و AMD است (البته نه به صورت همزمان) كه مي تواند برای گيمرها بسیار جذاب باشد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:23
تست و بنچ ماركينگ:
حال پس از آشنايي كامل با پردازندههاي Core i7 و معماري Nehalem بررسي كارآيي اين پردازندهها كه مهمترين مسئله مرتبط با اين نسل پردازندههاست ميپردازيم.
در اين بررسي از آخرين پردازندههاي چهارهستهاي دو شركت استفاده شده تا تفاوت بين آنها به خصوص تفاوت بين پردازندههاي Core i7 و Phenom II شركت AMD به خوبي مشخص شود.
(همچنين بايد یاداور شوم بدليل گستردگي پردازندهها و موجود نبودن تمامي اين مدلها در لابراتور خانه سخت افزار موفق به بررسي كامل اين پردازندهها نشديم لذا از نتايج بدست آمده از سايت معتبر Toms hardware استفاده كردهايم.)
مشخصات سيستم تست:
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در بخش نرم افزاری نیز از اخرین درایورها و نسخه های هر برنامه استفاده شده است.
street king
02-06-2009, 15:26
Sandra CPU and Multimedia:
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:29
Sandra Memory And Everest :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:32
Everest And PCMark Vantage :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:36
PC Mark And 3DMark :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:37
Crysis, UT3, WiC, Supreme Commander :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:38
AVG, Winrar, WinZip, Acrobat :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:40
PhotoShop, iTunes, Lame, Studio 12 :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:42
DivX, Xvid, Mainconcept, Premiere :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:43
Blu-ray, Cinema 4D, 3D Studio Max, Fritz, Nero 8 :
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 15:50
آينده معماری Nehalem:
از قديم گفتن سالي كه نكوست از بهارش پيداست.
معماري Nehalem سرشار از نوآوري و نبوغ است و همانطور كه تا اينجا شاهد بوديد معماري Nehalem و پردازندههاي Core i7 يك سر و گردن از تمامي پردازندههاي دو شركت كه تا كنون ارائه شدهاند بالاتر است، شايد تنها مشكل اين پردازنده را نبود پردازندههاي مبتني بر معماري Nehalemبا قيمتهاي پايينتر از 300 دلار است كه اينتل هم براي بدست آوردن سطح متوسط بازار كه عمدهي كاربردن در آن قرار مـيگيرد پـردازندههاي Core i5 با نام رمز Lynnfield همراه چيپست p55 و p53 را معرفي و تا چند ماه ديگر عرضه خواهد كرد و در صورتيكه AMD فكر چارهاي نينديشد باز ميتوان سهم عمدهاي از بازار را از آن اينتل دانست.
برنامه اعلام شده در سال 0052 تحت عنوان استراتژي تيك ـ تاك (Tick-Tock) مبني بر يك نوآوري در هر سال براي كاهش فناوري توليد پردازنده، معماري Nehalem با بروسه ساخت 32 نانومتري در اواخر سال 2009 و تحت عنوان Westmere ارائه ميشوند اين پردازندههاي 32 نانومتري در دو دستهي متفاوت عرضه ميشوند كه در دسته اول از 6 هسته و 12 Thread و دستهي دوم پردازندههايي هستند كه كنترلر كارت گرافيك نيز در آن جاي دارد و تنها از 2هسته بهره ميبرند كه با اين اقدام اينتل،پل شمالي به طور كامل از ميان برداشته ميشود.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
اما پس از معماري Nehalem پردازندههاي 32 نانومتري با گرافيك مجتمع تحت عنوان Sandy Bridge در سال 2010 عرضه ميشوند تا اينتل براي اولين بار توانسته باشد هر دو چيپست گرافيك و پردازنده (Cpu/Gpu) را تحت يك Package عرضه كند. (البته ايده Cpu/Gpu ابتدا توسط AMD مطرح شده اما با توجه به تعويق افتادن برنامههاي زماني AMD كه ديگر يك موضوع عادي شده است با 2 سال تاخیر در سال 2012 اتفاق ميافتد.)
نتيجهگيري:
Core i7 بار ديگر توانست قدرت بيچون و چرا اينتل را به رخ همگان بكشد و با ارائه پردازنده Core i7 و چيپست X58، پلتفورم كامل و كارآمد را عرضه كند. همانطور كه مشاهده كرديد تمامي مدلهاي Core i7 توانستند از تمامي پردازندهها قويتر ظاهر شده و به خصوص كه باز پردازندههاي جديد Phenom II شركت AMD نيز به هيچ عنوان نتوانستند با اين پردازندهها برابری داشته باشند براي مثال پردازنده Core i7 965 قويترين پردازنده اين مدل با. درصد تفاوت كارآيي نسبت به پردازنده 940 Phenom II توانست بسيار سريعتر ظاهر شود، اين درحاليست كه استفاده از پلنتفورم اينتل اين اجازه را نيز به كاربر ميدهد كه از هر دو تكنولوژي كراس فايرو 3-Way SLIبه سليقهي خود بهره ببرد .
يك كاربرد باهوش يتواند با خريد حداقل مدل 920 با قيمت 300 دلار پردازندهاي قويتر از پردازندهي QX97JO با قيمت 1300 دلار داشته باشد.
شايد تنها شكوهاي كه ميتوان نسبت به معماري Nehalem داشت عرضه پردازنده با سوكت و چيپستها متفاوت دانست Core i5 Lga1156 )و Core i7 Lga1366 ) كه براي تعويض پردازنده كاربر را دچار مشكل ميكند.
در پايان ميتوان به صراحت بيان كرد كه پردازندههاي Core i7 بسيار قويتر از پردازندههاي Phenom II شركت AMD بوده و بايد اينتل را برندهي اين ميدان دانست.
street king
02-06-2009, 15:52
انفجاري خفيف با Core i7:
مقدمه:
مطمئناً تاكنون صحبتها و نوشتههاي بسياري در موارد مبحث اوركلاكينگ را در مجلات، سايتها و يا هر كجاي ديگر شنيده و خواندهايد و اگر خود تا به حال اوركلاكينگ را تجربه نكردهايد حداقل با اين مبحث آشنايي داريد.
اوركلاكينگ پردازنده پرطرفدارترين جبههي اوركلاكينگ ميباشد چرا كه هم از لحاظ تأثير مستقيم بر روي كارآيي سيستم و همچنين طالب مسائل فني و تجهيزات مورد نياز بسته به سطح اوركلاكينگ می باشد باعث شده تا توجه بيشتر اوركلاكرها را به خود معطوف كند.
در اين مقاله سعي كردهايم بيشتر به یک تجربه ساده اوركلاكينگ بر روي سيستم تمركز كرده و با بيان نكات لازم در اوركلاكينگ اين نسل از پردازندهها توانسته باشيم مطالب مفيدي را در اختيار شما دوستان قرار دهيم.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
Core i7 , X58
صحبتها از معرفي معماري Nehalem شروع شد،ولتاژ كاري پايين، ضريب پردازنده بالا (20)، تكنولوژي QPI همه و همه نويد پردازندههايي با قابليت اوركلاكينگ فوقالعادهاي (حتي بالاتر از سريهاي E8000 ) را ميدادند، اما بالاخره پس از عرضه اين پردازندههاو پس از بررسيهاي به عمل آمده هرچند Core i7 توانسته بود انقلابي را در عرصه پردازندهها و همچنين كارآيي شگرفي را به نمايش بگذارد اما قابليت اوركلاكينگ اين پردازندهها اگر نگوييم كه نسبت به پردازندههاي سري E8000 كمتر شده بود، اما افزايشي هم نداشته و شايد هم یکی از دلايل عرضه پردازنده E8700 با فركانس 3500 از سري پردازندههاي دوست داشتني اينتل نيز براي جبران مافات و راضي نگه داشتن مشتاقان اوركلاك بود (مطمئن باشيد اوركلاكينگ به پردازنده E8700 بينهايت لذت بخش خواهد بود)
Core i7 پردازندهاي چهار هستهاي (اين يكي واقعاً چهار هستهاي هست!) با 8Thread بوده و داراي 8 مگابايت حافظه نهان سطح 3 و بهرهگيري از گذرگاه QPI به جاي رابطFSB و سوكت LGA 1366 گونهاي متفاوت از پردازندهها را معرفي كرده است.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ] [ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
در اين سير تحولات چيپست پل شمالي نيز بايد تغيير ميكرد و چيپست x58 نيز با تغييراتي چشمگير نسبت به چيپستهاي قبلي براي پشتيباني از اين پردازندهها به بازار معرفي شد.
street king
02-06-2009, 15:56
اوركلاكينگ:
ابتدا بايد قطعات مورد نياز را فراهم ميكرديم، همانطور كه در ابتدا گفته شد هدف اوركلاكي ساده بود پس به سراغ سادهترين مدل اين پردازنده يعني Core i7 920 رفتيم، بعد از پردازنده نیز مهمترين كامپونت مادربرد بوده كه به دليل نبود دو مادربرد Blood Rage شركت فاكسكان و Rampag II شركت ASUS به ناچار مادربرد ASUS P6t Delux را انتخاب كرده و با استفاده از حافظههاي XMS3 1333 شركت Corsair و خنك كنندهي قوي Hyper Z-6,, شركت كوكر مستر كه از قبل در لابراتوار موجود بود استفاده كرديم؛ مشخصات مابقي كامپونتها را ميتوانيد در جدول زير ببينيد.
مشخصات سيستم اوركلاكينگ:
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 16:02
پس از اسمبل سيستم،ابتدا دماي قسمتهاي مختلف سيستم را اندازهگيري ميكنيم كه نتايج از اين قرار بود:
پل شمال: 49 درجه سانتیگراد
پل جنوبي: 52 درجه سانتیگراد
پردازنده: 26 درجه سانتیگراد
و نتايج بدست آمده را قبل از اوركلاكينگ نيز يادداشت ميكنيم كه نتايج بدست آمده نيز بدين شرح بود:
Super pi:
14.695
3D Mark Vantage:
9880
3D Mark 06:
14988
تنظيمات بايوس:
ابتدا قابليتهاي غيرضروري همانند 1394 , Lan, USB و ... را كه به آنها نياز نداريم و همچنين يكسري از امكانات پردازنده را در سربرگ CPU Confiquration غيرفعال ميكنيم، فناوريهاي چون TM Fanction ، CIE support , Execute Disable Bit و ... .
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
حال سربرگ Ai Tweaker كه تنظيمات اصلي مربوط به اوركلاكينگ قراردارد را باز ميكنيم؛
ابتدا بايد توجه داشته باشید كه فركانس پردازنده ضريبي است از: فركانس مرجع × ضريب پردازنده كه در اينجا فركانس مرجع با BCLK Frequency و ضريب پردازنده با CPU Ratio setting نمايش داده ميشود
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
ضريب پردازنده در Core i7 920 ثابت ميباشد، لذا تنها با افزايش فركانس پايه ميتوانيم فركانس كاري پردازنده را افزايش دهيم؛ هم چنين بايد توجه داشته باشيد كه با تغيير اين پارامتر، سرعت QPI نيز افزايش پيدا خواهد كرد؛ البته اين در حالت Auto (خودكار) ميباشد و شما ميتوانيد آن را از حالت Auto خارج كرده و آن را ثابت نگه داريد.
اين افزايش فركانس خودكار براي حافظهها نيز وجود دارد كه كنترل اين پارامتر نيز ميتواند همانند كنترل فركانس QPI صورت گيرد كه در ادامه خواهيد ديد.
برای اينكه بحث را كوتاه كنيم تا از چارچوب حوصله شما هم خارج نشود ابتدا قصد داريم فركانس پردازنده را تا 4000 مگاهرتز افزايش دهيم بدين منظور ابتدا فركانس پايه را از 133 به 200 مگاهرتز افزايش ميدهيم (4000=x20×200) تا فركانس پردازنده 4000 به مگاهرتز افزايش پيدا كند، در اين حالت فركانس QPI نيز از 4.8 به 7.2 گيگا تكسل بر ثانيه افزايش پيدا ميكند كه بنا به تجربهي قبلي اين افزايش فركانس QPI را ميتوان با اعمال ولتاژ پايدار نگه داشت و لذا به همين خاطر آن را در حالت Auto قرار داده و تغييري در آن اعمال نميكنيم.
همانطور كه گفته شد با افزايش فركانس پايه فركانس حافظهها نيز افزايش پيدا ميكند و فركانس حافظههاي ما نيز به 1600 مگاهرتز افزايش پيدا كرده است كه با توجه به نوع حافظههاي موجود و همچنين تجربهي گذشته به ناچار فركانس حافظهها را به 1200 مگاهرتز كاهش داديم اين مقدار حتي كمتر از فركانس پيش فرض حافظههاست اما خوب چارهاي نيست!
حال ميماند فركانس uncore كه اين فركانس هم همانند فركانسهاي QPI و حافظهها وابسته به فركانس پايه بوده و در حالت خودكار با افزايش فركانس پايه، فركانس اين پارامتر هم افزايش پيدا ميكند كه البته ما اين قسمت را نيز همانند فركانس QPI در حالت Auto تنظيم ميكنيم.
البته اين نكته كه گفته ميشود فركانس uncore بايد 2 برابر فركانس حافظهها باشد و يا با ضريب 1+x2 باشد طبق آزمايشات ما در مواقعي كه حافظهها با فركانس پايين كار ميكنند زياد صادق نبوده و ميتواند بيشتر نيز باشد (البته تا حدي) كه ما نيز به همين خاطر فركانس Uncore را در حالت Auto باقي نگه داشتيم.
هم چنين بايد متذكر شوم كه مادربرد Asus P6T ضرايب مختلف را به شما نمايش نميدهد و تنها فركانسهاي حاصل از ضريب مختلف را ميتوانيد مشاهده كنيد به فرض مثال هنگاميكه ما فركانس حافظه را تا 1200 مگاهرتز كاهش داديم در اصل ضريب آن را به 6 كاهش داديم اما شما فقط فركانس 1200 مگاهرتز را مشاهده ميكنيد نه ضريب را.
سرانجام نوبت به اعمال ولتاژها ميرسد، به زبان ساده بايد قسمتهايي را كه در آنها افزايش فركانس داشتهايم را بايد اعمال ولتاژ كنيم البته با كمي حساسيت در مقادير اعمالي كه ولتاژهاي اعمالي ما از اين قرار است:
CPU Voltage: 1.4 (V)
CPU PLL Voltage: 7.98 (V)
QPI/ DRAM Core Voltage: 1.55 (V)
IOH Voltage: 1.38 (V)
ICH Voltage: 1.40 (V)
هم چنين بايد خاطر نشان شوم هرچند اعمال ولتاژ بيشتر تا حدي باعث ثبات بيشتر در اوركلاك ميشود اما از طرف ديگر باعث افزايش حرارت درسطح بسيار بالايي ميشود كه می تواند باعث شكست در اوركلاكينگ شود چرا كه اوركلاكينگ را می توان به گونهاي نبرد بين حرارت و خنك كننده دانست، لذا هميشه سعي كنيد تا حد امكان از ولتاژهاي پايينتر استفاده كنيد.
حال پس از اعمال تنظيمات لازم، سيستم را بوت ميكنيم؛ پس از بالا آمدن سيستم عامل ابتدا دماها را چك ميكنيم و پس از اطمينان با استفاده از نرمافزار super pi Mod ثبات و عملكرد اوركلاكينگ را ازمايش ميكنيم كه همانگونه كه در تصوير ميبينيد سيستم به طور تقریبی با افزايش كارآيي 30 درصدی رو به رو شدو برای اینکه پایداری کامل سیستم را ازمایش کنیم از نرم افزار wpime بهره می گیریم که نتاج بدست امده نیز بدین شرح است:
Super pi:
10.358
3D Mark Vantage:
11670
3D Mark 06:
18425
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
حال با موفقیت در اجرای wprime پارا يك قدم فراتر ميگذاريم تا فركانس پردازنده را به 4200 مگاهرتز افزايش دهيم پس دو مرتبه به محيط بايوس باز ميگرديم.
اما فقط مقدار فركانس پايه را به 210 مگاهرتز افزايش ميدهيم و بدون هيچ گونه تغيير ديگري دو مرتبه سيستم را بوت كرده و ثبات و عملكرد سيستم را دو مرتبه چك ميكنيم.
همانگونه كه در تصوير مشاهده ميكنيد باز اوركلاكينگ پردازنده موفقيت آميز بود اما اين بار دما تا 50 درجه سانتيگراد افزايش يافت كه بيشتر از اين دما ميتواند باعث اخلال در عملكرد سيستم شود.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
اما نكتهاي كه در فركانس 4200 حائز اهميت بود عدم تغيير در مقادير ولتاژها بود لذا ميتوان دريافت تا قبل از آنكه سيستم ناپايدار شود احتياجي به اعمال ولتاژ نداريم.
street king
02-06-2009, 16:04
اما در فركانس 4400 بدليل افزايش حرارت بيش از حد سيستم تقريباً ناپايدار بوده كه در ادامه برای كار دردمای زیر صفرناچاراً مجبور به استفاده از خنك كنندههاي دست ساز و نيتروژن مايع شديم كه بنا به هدف اين مقاله كه قصد ارائه نحوهاي ساده در اوركلاكينگ بود لذا تنها با درجه تصاوير ادامهي اوركلاكينگ را شاهد باشيد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
street king
02-06-2009, 16:06
نتيجه گيري:
همانطور كه مشاهده كرديد، اوركلاك پردازنده جداي از جذابيت كمك به سزايي در افزايش كارآيي و هم چنين صرفه جويي در مصرف هزينه ميكند. همانطور كه در جدول زير مشاهده ميكنيد دو مدل 920 و 940 هيچ گونه تفاوتي با يكديگر ندارند و تنها تفاوت آن در فركانس كاري 2 پردازنده ميباشد كه تنها 300 مگاهرتز بين اين دو اختلاف است. با اين تفاوت كه مدل 940 حداقل 200 هزار تومان گرانتر از مدل 920 ميباشد كه شما با خريد مدل پايينتر يعني مدل 920 ميتوانيد با يك اوركلاك ساده اين تفاوت ناچيز را جبران كرده و در مصرف هزينههاي خود نيز صرفهجويي كنيد.
[ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]
اما در مورد قابليت اوركلاكينگ كامپونتهاي استفاده شده بايد گفت كه مادربرد Asus P6T هرچند به منظور اوركلاكينگ طراحي نشده است ولی درحد خود راضی کننده ظاهر شد اما در اين رنج قيمت مطمئناً گزينههاي بهتري نيز براي اوركلاكينگ پيدا ميشود. در مورد اين نسل از پردازندهها نيز بايد منتظر ماند تا هستههاي ديگر نيز روانه بازار شوند تا بهتر بتوان نتيجهگيري نمود اما در طرف ديگر حافظهها و خنك كننده نيز در نوع خود بسيار عالي عمل كردند.
vBulletin , Copyright ©2000-2025, Jelsoft Enterprises Ltd.