PDA

نسخه کامل مشاهده نسخه کامل : ساخت فايل هاي sitemap با استفاده از نرم افزار Google Sitemap Generator



Mohammad
21-01-2007, 12:04
از راه هاي ساخت فايل هاي sitemap استفاده از نرم افزار ويژه شركت گوگل با عنوان Google Sitemap Generator است.نرم افزار Google Sitemap Generator در واقع همان اسكريپتهاي python است كه با استفاده از پروتكل Sitemap اقدام به ساخت چنين فايلهايي مي كند. اين اسكريپت قابليت ساخت فايل هاي sitemap را به طرق مختلف دارد. استفاده از ليست آدرس ها، دايركتوريهاي قرار گرفته در وب سرورها و فايل ثبت درسترسي ها (Access Logs) .
براي استفاده از اين نرم افزار به نكات زير توجه نماييد:
- براي اجراي اسكريپتهاي python مي بايست امكان اجراي اين كدها را بر روي وب سرور خود داشته باشيد.
- بر روري وب سرور شما مي بايست Python 2.2 و يا نسخه هاي بالاتر آن نصب شده باشد.
- مي بايست از نحوه استفاده از Python موجود بر سرور آگاه باشيد.
- مي بايست آدرس فيزيكي وب سايت خود را در سرور بدانيد.
- امكان آپلود فايل به سرور را داشته باشيد.
- اگر براي ساخت sitemap از access logها استفاده مي نماييد، علاوه بر آگاهي بر نحوه كدگذاري (encoding) آنها مي بايست از مسير قرارگيري آنها نيز اطلاع داشته باشيد.
- در صورتي كه حتي از يكي از وارد فوق مطلع نيستيد، موضوع را با شركت خدمات ميزباني وب سايت خود در ميان بگذاريد.

دانلود فايلهاي مورد نياز براي استفاده از Sitemap Generator :
براي استفاده از اين نرم افزار ابتدا لازم است آن را از آدرس زير دانلود نماييد.


برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

نكات مورد نياز براي ساخت فايل پيكربندي :
براي ساخت فايل پيكربندي مورد نياز نرم افزار بايد از اطلاعات زير آگاه باشيد:
- آدرس اصلي وب سايت خود (همراه با پروتكل مورد استفاده. براي مثال ([ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ])
- آگاهي از مسير قرار گيري فايل sitemap جهت ذخيره فايل در آدرس مورد نظر.
- روش ها (متد)يي كه براي ساخت فايل sitemap نياز داريد. روشهاي زير وجود دارند:
URL : تعيين مستقيم ليست urlها و اطلاعات مربوط به هر يك، جهت قرار گرفتن در فايل sitemap
URL list : آدرس دهي به فايل متني (text) از پيش ساخته شده، جهت ساخت ليست آدرس صفحات بر اساس اطلاعات موجود در آن.
Directory paths : تعيين مسير دايركتوري خاص براي ليست نمودن فايل هاي موجود در آن در فايل sitemap
Access logs : آدرس دهي به فايل Access logs از پيش ساخته شده توسط Apacheو IIS، جهت تهيه ي ليست آدرس صفحات بر اساس اطلاعات موجود در آن.
Sitemap : آدرس دهي به ديگر فايلهاي Sitemap ساخته شده توسط اين نرم افزار و ساخت فايل sitemap واحد.


نحوه ساخت فايل پيكر بندي:
1. فايل example_config.xml را به وسيله نرم افزارهاي ويرايشگر باز نماييد (نرم افزارهايي چون Notepad, FrontPage, DreamWeaver و ...). سپس آن را با نام ديگري مجددا ذخيره كنيد (براي مثال config.xml).

2. در خط 34 كدهاي اين فايل كد زير مشاهده مي شود:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید


3. مقدار اختصاص يافته به base_url را به آدرس سايت خود تغيير دهيد.

4. مسير و نام فايل sitemap سايت خود را جهت قرارگرفتن در آن مسير، با مقدار اختصاص يافته به store_into تعويض كنيد.

* مشخصه هاي اختياري جهت استفاده در تگ :site

Verbose:
با افزايش مقدار اين مشخصه (0 تا 3) اطلاعات نمايش داده شده به هنگام اشكال زدائي را افزايش دهيد.

suppress_search_engine_notify : اگر براي اولين بار است كه قصد استفاده از اين نرم افزار را داريد ممكن است جهت آزمايش نرم افزار فايل sitemap‌ي بسازيد كه نيازي به مرور آن توسط موتورهاي جستجو نباشد. در اين حالت مقدار اين مشخصه را برابر 1 قرار دهيد. بدين ترتيب وجود فايل sitemap با نبودن آن تفاوتي نخواهد داشت!


default_encoding : تعيين شيوه ي كدگذاري كاراكترها جهت به كار بردن براي فايل ها و آدرس هاي به كار گرفته شده. (براي آشنايي با انواع كدگذاري به ادامه اين مقاله توجه فرماييد)


* بهترين محل براي قرار دادن فايل sitemap ريشه سايت است. لذا در اين بخش بهتر آن است كه تنها نام فايل را
وارد نماييد و بدين ترتيب به نرم افزار اعلام مي كنيد كه فايل را در ريشه سايتتان ذخيره كند.

5. حال به بخش بعدي كه با عبارت ** MODIFY or DELETE ** آغاز شده است برويد. در هر بخش آغاز شده با اين عبارت روش(متد)هاي مختلف جهت ساخت فايل Sitemap قرار گرفته است.

6. قسمتهاي مربوط به متدهاي مورد نظر خود را باقي گذاشته و بخشهاي اضافي را حذف كنيد. براي مثال اگر تنها مايل به استفاده از متد URL‌ نيستيد،بخش مربوط به آن كه حاوي اطلاعات زير است را حذف نماييد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

7. براي استفاده از متدهاي مورد نظر توضيحات ارائه شده براي
هريك را مطالعه نموده و طبق آن عمل نماييد.

URL
كد زير را پيدا كنيد:


برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

در اين بخش دو مثال آورده شده است. در مثال اول از ابتدايي ترين تنظيمات جهت استفاده از اين متد استفاده شده است و در مثال دوم از ويژگي هاي اختياري اين متد نيز بهره برده است.
به هنگام استفاده از اين متد، جهت معرفي هر صفحه از صفحات سايت خود مي بايست چنين كدي براي هر صفحه نوشته شود. يعني براي ثبت ده صفحه سايت خود، بايد ده بار اين كد را با اعمال تغييرات مربوط به هر لينك بنويسيد.

مشخصه هاي قابل استفاده در اين متد:

Href (اجباري)
آدرس صفحه ي مورد نظر جهت قرارگيري در فايل sitemap

Lastmod (اختياري)
آخرين زمان اعمال تغييرات در صفحه معرفي شده كه با استاندارد ISO 8601 تعيين مي گردد. (الگوي كلي به شكل YYYY-MM-DDThh:mm:ss+00:00 است و در آن تعيين زمان اختياري است)

Changefreq (اختياري)
با استفاده از اين مشخصه، زمان به روز رساني صفحه معرفي شده را تعيين نماييد. براي مثال اگر مقدار مشخص شده در مشخصه ي href همان آدرس صفحه ي "درباره ما" (About Us) سايت شما مي باشد، به دليل آنكه اين صفحه شايد هيچگاه تغيير نكند و لزومي به بررسي مجدد و مرور آن توسط گوگل وجود ندارد، مي توانيد مقدار changefreq را براي آن برابر never قرار دهيد.از ديگر مقادير مورد قبول اين مشخصه مي توان به always و hourly و daily و weekly و monthly و yearly اشاره نمود كه به نظر نيازي به توضيح تك تك آنها نيست!

Priority (اختياري)
با استفاده از اين مشخصه ارجحيت نسبي صفحه معرفي شده را نسبت به ديگر صفحات سايت خود بيان نماييد. اين مشخصه هيچ تاثيري در مقايسه صفحات سايت شما با صفحات ديگر سايت ها ندارد و تنها به گوگل اهميت صفحات مورد نظر شما را اطلاع مي دهد. با استفاده از اين مشخصه اولويت مرور و بازخواني صفحات را به spiderهاي موتور
جستجو اطلاع دهيد. مقدار معتبر تخصيص داده شده به اين مشخصه بين 0.0 و 1.0
مي باشد كه 0.0 نشان دهنده درجه پايين اهميت و 1.0 نشانه پر اهميت بودن صفحه معرفي شده است.


مثال جهت آشنايي بيشتر:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

URL List:

كد زير را پيدا كنيد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

از اين متد به هنگامي استفاده مي شود كه آدرس صفحات مورد نظر شما در فايل متني (text) خاصي ذخيره شده
باشد. جهت استفاده از اين روش بايد فايل متني مورد اشاره مطابق با دستور العمل خاص و مشابه با نمونه تهيه شده (فايل example_urllist.txt موجود در پوشه دانلود شده)، ذخيره گردد.


مشخصه هاي قابل استفاده در اين متد:

Path (اجباري)
مشخص كننده آدرس فايل متني مورد نظر است كه نسبت به محل قرار گيري فايل sitemap تعيين مي گردد. بدين معني كه اگر فايل sitemap شما در ريشه قرار گرفته است و فايل متني حاوي ليست آدرسها نيز در همان مكان قرار دارد، تنها ذكر نام فايل به همراه پسوند آن كفايت مي كند.


Encoding (اختياري)
در صورتي كه كدگذاري (encoding) فايل متني شما UTF-8 نيست از اين مشخصه براي تعيين شيوه كدگذاري مورد استفاده در آن استفاده نماييد. (براي آشنايي با انواع كدگذاري به ادامه اين مقاله توجه فرماييد)



توضيحاتي در ارتباط با فايل متني حاوي آدرس صفحات:
اين فايل يك فايل ساده متني است كه شامل آدرس صفحات و مشخصه هاي مورد نياز هريك مي باشد. در اين حالت آدرس صفحات و مشخصه هاي هر يك، در يك خط قرار مي گيرند. بدين شكل:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

لازم به ذكر است در اين حالت نيز مي توان از مشخصه هاي Lastmod ، Changefreq و Priority معرفي شده در متد پيشين استفاده نمود.

مثال جهت آشنايي بيشتر:

برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

Directory paths
كد زير را پيدا كنيد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

با استفاده از اين متد قادر خواهيد بود ليست فايلهاي موجود در پوشه اي خاص را براي استفاده در Sitemap آماده سازيد.
در اين قسمت دو مثال آورده شده است. اگر تمامي فايلهاي مورد نظر شما در زير شاخه هاي يك مسير خاص ذخيره شده اند، تنها وارد نمودن مسير آن كفايت مي كند. در صورتي كه بيش از يك زير شاخه وجود دارد، اشاره به نام و مسير هر يك از زير شاخه ها الزاميست.


مشخصه هاي قابل استفاده در اين متد:

Path (اجباري)
تعيين كننده مسير آغاز به كار. نرم افزار Sitemap Generator براي دستيابي به نام و اطلاعات مربوط به فايلها از اين مسير عمليات خود را آغاز مي كند.

url (اجباري)
تعيين كننده آدرس url هم ارز با مسير تعيين شده در مشخصه path

default_file (اختياري)
تعيين فايل پيش فرض براي دايركتوري هاي روي سرور


Access Logs
كد زير را پيدا كنيد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

با استفاده از اين متد امكان استفاده از فايلهاي اختصاصي ساخته شده توسط Apache و IIS كه شامل اطلاعات مربوط به فايلهاي موجود است، ميسر مي شود. در اين قسمت سه مثال آورده شده است.

مشخصه هاي قابل استفاده در اين متد:

Path (اجباري)
تعيين كننده مسير فايل حاوي اطلاعات

Encoding (اختياري)
در صورتي كه كدگذاري استفاده شده در فايل مورد استفاده، US-ASCII و يا UTF-8
نيست از اين مشخصه براي تعيين نوع آن استفاده مي گردد. (براي آشنايي با انواع
كدگذاري به ادامه اين مقاله توجه فرماييد)
همانطور كه ملاحظه فرموديد در كد
فوق سه فايل معرفي شده اند. با كمي دقت به شباهت بسيار زياد بين نام و آدرس اين
سه فايل پي خواهيد برد. در چنين مواقعي مي توان با خلاصه نويسي و تنها با يك خط
كد كار معرفي سه فايل را در آن واحد انجام داد. براي رسيدن به اين مقصور به
شيوه ي زير كد را تغيير دهيد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

نرم افزار Sitemap Generator براي تعيين ارجحيت صفحات ذكر شده در فايل log به تعداد دفعات مشاهده صفحات (hit) دقت مي كند. بدين ترتيب كه هرچه تعداد دفعات بازديد ثبت شده براي يك صفحه بيشتر باشد، رتبه ي آن از لحاظ ارجحيت بالاتر خواهد بود.



Sitemap
كد زير را پيدا كنيد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

براي استفاده از كد فوق مقدار مشخصه path را به مسير فايل sitemap قرار گرفته در سايت خود تغيير دهيد.
نرم افزار Sitemap Generator آدرس url تمامي صفحات موجود در sitemapهاي معرفي شده را بدست آورده و آن ها را در يك sitemap جديد ذخيره مي كند.
لازم به ذكر است استفاده از اين متد براي بدست آوردن urlهاي موجود در sitemapهاي تهيه شده توسط نرم افزارهايي به غير از Sitemap Generatorهميشه جواب نمي دهد.


مشخصه هاي قابل استفاده در اين متد:

Path (اجباري)
تعيين كننده آدرس فايل sitemap مورد نظر
8. كد معرفي كننده ف ي ل ت ر را كه مطابق كد زير است پيدا كنيد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

با استفاده از اين ف ي ل ت ر قادر به جلوگيري از ليست شدن بعضي از صفحات به دلايل متفاوت خواهيد بود.
دقت داشته باشيد اگر براي جلوگيري از ثبت شدن لينك صفحات خاصي از سايتتان از فايل robots.txt ([ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ]) استفاده مي كنيد، حتي اگر ليست صفحات مورد نظر در فايل sitemap ساخته شده قرار گرفته باشد، اين صفحات توسط موتور جستجوي گوگل مرور نخواهند شد.


مشخصه هاي قابل استفاده براي ف ي ل ت ر:

Action (اختياري)
با استفاده از اين مشخصه نحوه برخورد با آدرس صفحات معرفي شده را تعيين نماييد.
مقادير معتبر براي اين مشخصه عبارتند از drop و pass :
Drop : تعيين مي كند كه صفحات مطابق با الگوي تعريف شده
براي فيلتر، از ليست ساخته شده در sitemap حذف شوند. (اين مقدار به صورت پيش
فرض در نظر گرفته خواهد شد. لذا اگر اين مشخصه تعريف نگردد گوگل فرض را بر
مقدار drop گذاشته و صفحات مطابق الگوي تعريف شده را از ليست حذف مي كند.)
Pass : تعيين مي كند كه صفحات مطابق با الگوي تعريف شده براي فيلتر، در ليست
ساخته شده در sitemap قرار گيرند.


Type (اختياري)
نوع ف ي ل ت ر با استفاده از اين مشخصه تعيين مي گردد. مقادير معتبر براي اين مشخصه عبارتند از wildcard و regexp :
Wildcard : مشخص مي كند كه الگوي تعريف شده با استفاده از كاراكتر هاي * و ? ساخته شده است. (اين مقدار به صورت پيش فرض در نظر گرفته خواهد شد. لذا اگر اين مشخصه تعريف نگردد گوگل فرض را بر مقدار wildcard گذاشته و الگوي تعريف شده را با توجه به قواعد مربوط به آن بررسي مي كند.)
regexp : مشخص مي كند كه الگوي تعريف شده، با استفاده از
عبارات با قاعده (regular expressions) ساخته شده است.

Pattern (اجباري):
تعيين كننده الگوي مورد بررسي با توجه به نوع ف ي ل ت ر انتخابي.

انواع كدگذاري ها (Encodings)
كدگذاري هاي معمول براي استفاده در sitemap عبارتند از:
encoding="utf-8"
به صورت پيش فرض در نظر گرفته مي شود.

encoding="ascii"
زير مجموعه اي از utf-8 بوده و نيازي به تعريف آن نيست.

encoding="iso-8859-1"
معمولا براي زبان هاي اروپاي غربي به كار مي رود.



انتقال فايل ها به سرور:
براي استفاده از نرم افزار Google Sitemap Generator لازم است فايل هاي زير را در جايي از وب سايت خود كه به فرمان هاي python دسترسي داريد آپلود كنيد.

config.xml : اين فايل همان نمونه ي تغيير داده شده ي فايل example_config.xml ابتدايي است.
sitemap_gen.py:‌ اسكريپتهاي python براي ساخت sitemap دلخواه
urllist.txt : در صورتي كه از متد URL list براي ساخت فايل sitemap استفاده مي كنيد، اين
فايل را آپلود نماييد. در غير اين صورت نيازي به آپلود نمودن آن نيست.

اجراي اسكريپت نرم افزار Sitemap Generator (فايل sitemap_gen.py):
براي اجراي فايل sitemap_gen.py مي بايست به وب سرور خود متصل شويد. انتخاب نحوه اتصال به وب سرور به خودتان بستگي دارد (SSH و ...). براي آگاهي بيشتر از نحوه اتصال، با ميزبان وب خود تماس بگيريد.
پس از اتصال به وب سرور، جهت اجراي اسكريپت فرمان زير را وارد نماييد. (مقدار <path/config.xml> را با مسير و نام فايل پيكربندي خود عوض كنيد. در صورتي كه فايلهاي آپلود شده در همان محل اسكريپتهاي Python قرار گرفته
اند، ذكر نام فايل كفايت مي كند.)



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

نكته: در صورتي كه اجراي دستورات فوق را تنها براي آزمايش انجام مي دهيد از كد زير استفاده نماييد.

حال ميبايست نتيجه كار را به شكل نوشته هايي مشابه نوشته هاي
زير مشاهده نماييد:




برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

در صورتي كه متن نمايش داده شده براي شما تفاوت زيادي با كد فوق دارد به اين نكته دقت كنيد كه مقدار مشخصه verbose استفاده شده در اين مثال برابر 1 است و تغيير در مقدار آن رابطه مستقيمي با حجم متون نمايش داده شده دارد.
هرگونه خطايي با نمايش توضيح مربوط به آن به اطلاع شما خواهد رسيد. براي مثال اگر مشخصه url مربوط به متد directory را وارد نكرده باشيد با خطاي زير روبرو خواهيد شد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

ثبت فايل sitemap سايت خود در گوگل :
پس از تهيه ي فايل sitemap.xml.gz يكبار با استفاده از مرورگر وب خود به آن متصل شويد و از قابل دسترسي بودن آن اطمينان حاصل كنيد. سپس آدرس فايل مذكور را در حساب كاربري خود در بخش sitemap سايت گوگل ثبت نماييد. ([ برای مشاهده لینک ، لطفا با نام کاربری خود وارد شوید یا ثبت نام کنید ])
عمل ثبت فايل sitemap را تنها يكبار انجام دهيد و براي مطلع كردن گوگل از آخرين تغييرات آن از روش معرفي شده ي مخصوص به آن استفاده نماييد. (با همه ي اين تفاسير در صورت نياز مي توانيد مجددا فايل sitemap را در گوگل به ثبت برسانيد).- نحوه ثبت اطلاعات در مقالات بعدي معرفي خوهد شد -

تنظيمات جهت اجراي مجدد اسكريپت و به روز رساني فايل sitemap :
پيشنهاد مسئولين گوگل آن است كه در صورت امكان با تغيير تنطيمات، دوره ي اجراي مجدد اسكريپت را به "هر ساعت" (per hour) تغيير دهيد تا از وجود فايل sitemap بيشترين بهره را ببريد.
صاحبان سايتهايي كه سرور خدمات ميزبانيشان يونيكس است ميتوانند از cron job بهره ببرند و صاحبان سايتهايي كه از ديگر پلتفورمها استفاده مي كنند براي آگاهي از نحوه انجام اين عمل با مسئول ميزباني وب خود تماس حاصل فرمايند.

اشكال يابي:
در اين بخش به مرور چند خطاي احتمالي به هنگام كار با اين نرم افزار مي
پردازيم:
1. نرم افزار Sitemap Generator زير را نمايش مي دهد:



برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید

چه اتفاقي روي داده است؟
نرم افزار Sitemap Generator فايل مورد نظر را ساخته و در مسير مقرر ذخيره كرده است ولي هنگامي كه قصد مشاهده آن را كرده است (با استفاده از پروتكل HTTP) با خطايي مواجه شده و آن را به اطلاع شما رسانيده است.
اين اتفاق به علت عدم تطابق بين آدرس فيزيكي و URL معرفي شده براي sitemap رخ داده است.
روش اي رفع اين خطا چيست؟
براي برطرف نمودن اين خطا آدرس URL و مسير مشخص شده براي sitemap را با يكديگر مقايسه كرده و در صورت اشتباه وارد كردن يكي از آنها در فايل config.xml ، پس از تصحيح مجددا با استفاده از نرم افزار Sitemap Generator فايل sitemap جديد را بسازيد.

2. نرم افزار Sitemap Generator خطاي زير را نمايش مي دهد:


برای مشاهده محتوا ، لطفا وارد شوید یا ثبت نام کنید
چه اتفاقي روي داده است؟
همانطور كه از متن خطا مشخص است بعضي از نسخه هاي Python پشتيباني كاملي از XML ندارند. لذا امكان كار با فايلهاي XML ميسر نشده و عمل ساخت sitemap با مشكل روبرو شده است.
روش رفع اين خطا چيست؟
با خدمات ميزباني سايت خود تماس گرفته و نسبت به نصب كامل و نسخه بروز شده Python اقدام نماييد.
* دقت داشته باشيد در صورتي كه امكان استفاده از ساير نرم افزارهاي سازنده فايل sitemap براي شما فراهم است مي توانيد از وجود چنين نرم افزارهايي بهره ببريد. اين خطا تنها به دليل عدم هماهنگي python نصب شده بوده و دليلي براي اجرا نشدن ديگر نرم افزارها ندارد.

3. آدرس دامنه سايت شما (domain) از كاراكترهايي غير از كاراكترهاي ASCII تشكيل شده است.
عموما دامنه هايي كه از كاركترهاي غير اسكي استفاده مي كنند مي بايست با استفاده از UTF-8 كدگذاري شوند. ولي در اين بين استثنائاتي نيز وجود دارد. در صورتي كه در دامنه ي سايت شما از چنين كاراكترهايي استفاده شده است از مشخصه default_encoding براي مشخص نمودن شيوه ي كدگذاري مناسب استفاده نماييد.


-----------------
منبع:taklearn