تبلیغات :
ماهان سرور
آکوستیک ، فوم شانه تخم مرغی ، پنل صداگیر ، یونولیت
دستگاه جوجه کشی حرفه ای
فروش آنلاین لباس کودک
خرید فالوور ایرانی
خرید فالوور اینستاگرام
خرید ممبر تلگرام

[ + افزودن آگهی متنی جدید ]




نمايش نتايج 1 به 3 از 3

نام تاپيک: ری‌کپچا: سازمان بازيافت متون قديمی

  1. #1
    حـــــرفـه ای Jalal's Avatar
    تاريخ عضويت
    Jun 2006
    محل سكونت
    تهران و حومه
    پست ها
    7,972

    پيش فرض ری‌کپچا: سازمان بازيافت متون قديمی

    در حالت عادی هيچ کسی دوست ندارد که رو دست بخورد ولی گاهی وقت‌ها رودست خوردن چنان شيرين می‌شود که ممکن است به استقبالش هم برويم. درباره بازی برچسب‌زنی گوگل نوشتيم که چگونه ممکن است همراه بازی به بهينه‌سازی جست‌وجو در گوگل کمک کرد. اين بار اما صحبت از «کپچاهای ترجمه» است. روشی که باعث می‌شود تا يک کتاب ناخوانا، قابل خواندن شود. ترجمه يک کتاب غيرقابل خواندن به کتابی خواندنی.

    جنگ اسپمرها
    کپچا يک عکس با حروف و اعداد کج و معوج است که شما هنگام پر کردن يک فرم در اينترنت بارها با آن برخورد کرده‌ايد. خاصيت کپچا (CAPTCHA) اين است که انسان می‌تواند به‌سادگی آن را بخواند ولی در حال حاضر يک ماشين (کامپيوتر) نمی‌تواند. سايت‌های زيادی از کپچا استفاده می‌کنند تا فرستندگان هرزنامه (Spam) نتوانند خراب‌کاری کنند.
    خراب‌کاران عقب‌نشينی نمی‌کنند. آنها شمشير را از رو بسته‌اند و راه‌هايی برای مقابله با کپچاها دارند. يک راه هرزنامه‌نويسان (Spammer) در اين مبارزه، ايجاد سايت‌های پورنوگرافی هست. آنها يک سايت پورنوگرافی درست می‌کنند و در بخش ثبت‌نام، کپچايی را قرار می‌دهند که از سايت موردعلاقه‌شان برداشته شده است. شما برای ديدن محتوای سايت پورنوگرافی مجبور هستيد معمای کپچا را حل کنيد. اينجاست که هرزنامه‌نويس ورودی شما را به نفع خود مصادره می‌کند و شما در نقش يک کارگر هوسران، مشکل هرزنامه‌نويسان را حل می‌کنيد. [+]

    دو روی سکه
    اين تنها يک روی ماجراست. روزانه بيش از 60 ميليون کپچا توسط ميليون‌ها کاربر پر می‌شوند. دانشمندان هم تصميم گرفته‌اند مانند هرزنامه‌نويسان از اين خاصيت استفاده کنند. با اين تفاوت که کمتر کسی ناراضی خواهد بود.
    اين بار به جای توليد اتفاقی کپچاها به صورت حروف و اعداد، کلماتی قرار داده می‌شود که از کتاب‌های قديمی اسکن شده‌اند. در مورد کتب قديمی هم مشکل بازيابی حروف توسط ماشين برقرار است. شما با تشخيص اين حروف در حال کمک به بازيابی متن يک کتاب قديمی هستید و برگی به دانش بشر می‌افزاييد.

    يک باگ کوچولو
    تنها سؤالی که ممکن است برايتان پيش بيايد اين است که متن کپچاهايی که برای مقابله با اسپمرها در سايت قرار داده می‌شود مشخص است. يعنی ماشين نسخه درستش را دارد و با مقايسه آنچه شما وارد می‌کنيد، انسان بودنتان را تشخيص می‌دهد. حال پرسش اين است: اگر ماشين می‌دانست که متن بريده‌شده از کتاب قديمی چيست که دیگر نيازی به همکاری انسان برای ترجمه و درک آن نبود!
    شما درست می‌گوييد. اما راه‌های زيادی برای تأييد رشته ورودی وجود دارد. يکی آن که هر تکه از کتاب را برای دو نفر نمايش دهند و در صورت تطابق ورودی‌های دو نفر، درستی ورودی تأييد شود (درست مانند بازی برچسب‌زنی گوگل). راه ديگر آن که به هر فرد دو رشته اختصاص داده شود. متن يکی از اين رشته‌ها قبلاً و در فرآيندی جداگانه تشخيص داده شده اما محتوای دومی نامعلوم است. اگر فردی ورودی رشته اول را درست وارد کرد، ماشین به طور منطقی نتيجه می‌گيرد که به احتمال زياد متن دوم هم درست وارد شده است.

    هرزنامه کافی‌ست، کتاب بخوانيد
    سايت ری‌کپچا دقيقاً به همين منظور ايجاد شده است. «هرزنامه کافی‌ست، کتاب بخوانيد» اين شعار سايتی است که می‌خواهد متون کتب قديمی را بازيافت کند. اين پروژه کدباز (Open Source) که توسط دانشکده کامپیوتر دانشگاه «کارنگی ملون» دنبال می‌شود، توانسته پشتيبانان قدرتمندی چون شرکت اینتل و ناول برای این کار بيابد. در عين حال هر کسی که علاقمند است تا بازديدکنندگان سايت يا وبلاگش را به همکاری با اين کار دعوت کند، می‌تواند با عضويت در سايت ری‌کپچا کدی دريافت کرده و آن را در سايت خود قرار دهد تا بازديدکنندگانش در اين امر خير، مشارکت کنند. شما چطور؟ نمی‌خواهيد بازيافت را امتحان کنيد؟

    پاورقی:

    کپچا چیست؟
    شما هنگام پر کردن فرم‌های عضويت در سايت‌ها حتماً به تصويری برخورد کرده‌ايد که مجموعه‌ای از اعداد و حروف کج و معوج را در خود جای داده‌اند. هيچ گاه فکر کرده‌ايد که اين تصاوير کهCaptcha ناميده می‌شوند به چه دردی می‌خورند؟
    اگر با شيوه کارکرد موتورهای جست‌وجو آشنا باشيد، می‌دانيد که روبات‌های جست‌وجو به چه عواملی حساس هستند. شايد بارها از خود پرسيده‌ايد که ترتيب نمايش سايت‌ها در صفحه نتايج جست‌وجوی يک کلمه در گوگل بر چه اساس است. يعنی چرا سايت «الف» بالاتر از سايت «ب» نمايش داده می‌شود. يکی از علت‌ها اين است که کلمه مورد جست‌وجوی شما در سايت‌ها و وبلاگ‌های زيادی درج شده است. اگر در مجموع، اين کلمه به سايت «الف» بيشتر لينک شده باشد از نظر موتور جست‌وجو سايت «الف» به کلمه مورد نظر شما بيشتر مربوط است و در نهايت رتبه بهتری را نسبت به سايت «ب» در نتايج جست‌وجو به خود اختصاص خواهد داد [+]. برخی مواقع از اين خاصيت ارتباطی سوءاستفاده می‌شود. مثال بارز آن را در «بمب‌های گوگلی» می‌بينيد. در مورد بمب گوگلی خليج فارس، تعداد زيادی وبلاگ کلمه «خليج عربی» را به صفحه‌ای لينک کردند که در آن جمله «خليج عربی وجود ندارد» مشاهده می‌شد. پس از عمل کردن بمب، نخستين نتيجه جست‌وجو برای «خليج عربی» به اين صفحه اشاره می‌کرد.
    برخی از سايت‌ها از اين خاصيت گوگل سوءاستفاده می‌کنند. آنها روبات‌هايی را به جان صفحات اينترنتی می‌اندازند تا هر جا که فرمی شبيه به نظرخواهی ديده شد، يک لينک به سايتشان در آنجا درج شود و به اين ترتيب رتبه سايت در گوگل بالا برود.
    کپچا برای جلوگيری از اين نوع تقلب‌ها کاربرد پيدا می‌کند. متن درون يک کپچا که متشکل از حروف و اعداد تغييرشکل داده‌شده است، توسط روبات‌ها غيرقابل خواندن است. تکنيک‌های بازشناسی حروف توسط کامپيوتر (OCR) هم در اغلب مواقع از اين تشخيص عاجزند. تنها هوش انسانی است که می‌تواند اين حروف و اعداد را بشناسد. شما که در حال پر کردن چنين فرمی هستيد، می‌توانيد يک کپچا را تشخيص دهيد و آن را در کادر وارد کنيد اما يک روبات دقيقاً همين جا با بن‌بست مواجه می‌شود.
    osyan.net

  2. #2
    اگه نباشه جاش خالی می مونه emra228's Avatar
    تاريخ عضويت
    Feb 2007
    محل سكونت
    توی فکرش
    پست ها
    219

    پيش فرض

    بنظرت کسی پیدا می شه که وقتش رو بگذاره این همه متن رو بخونه؟
    اگه پیدا بشه بدون اطلاعات خیلی براش مهمه

  3. #3
    حـــــرفـه ای Jalal's Avatar
    تاريخ عضويت
    Jun 2006
    محل سكونت
    تهران و حومه
    پست ها
    7,972

    پيش فرض

    بنظرت کسی پیدا می شه که وقتش رو بگذاره این همه متن رو بخونه؟
    اگه پیدا بشه بدون اطلاعات خیلی براش مهمه

    شما شاید نخونی
    اما کسانی هستند که به این مسائل علاقه دارن

Thread Information

Users Browsing this Thread

هم اکنون 1 کاربر در حال مشاهده این تاپیک میباشد. (0 کاربر عضو شده و 1 مهمان)

User Tag List

قوانين ايجاد تاپيک در انجمن

  • شما نمی توانید تاپیک ایحاد کنید
  • شما نمی توانید پاسخی ارسال کنید
  • شما نمی توانید فایل پیوست کنید
  • شما نمی توانید پاسخ خود را ویرایش کنید
  •