PDA

نسخه کامل مشاهده نسخه کامل : درباره‌ی فناوری "تشخیص حروف با نور"



Mohammad
18-08-2007, 18:53
هر چه که بنویسی می‌فهمم!
-------------------------------------

از تایپ کردن خسته شده‌اید؟ نمی‌توانید مدت زمان زیادی را به نوشتن و دوباره تایپ کردن یک متن طولانی دانشگاهی یا گزارش خبری‌تان اختصاص دهید؟ می‌خواهید صفحات یک کتاب را اسکن کنید تا بتوانید قسمتهای مورد نیازش را حذف و برخی قسمتهای دیگر را برای ویرایش و تغییر انتخاب کنید اما وقت ندارید؟ نامه‌یی طولانی نوشته‌اید اما آنقدر بدخط است که فقط خودتان می‌توانید بخوانیدش و مجبورید دوباره تایپ کنید؟ پیشنهاد ما این است که از فناوری نوین و جالب OCR استفاده کنید.
فناوری تشخیص یا ادراک نوری حروف که از آن به عنوان Optical Character Recognition یا اختصاراً OCR نام می‌برند، یکی از انواع نرم‌افزارهای کامپیوتری است که برای ترجمه‌ی تصاویر حاوی دست‌نوشته‌ها یا تایپ‌نوشته‌های غالباً ثبت‌شده توسط اسکنر به متن و حروف قابل درک و فهم برای کامپیوتر استفاده می‌شود.
این فناوری از تشخیص قالب و الگو، هوش مصنوعی و چشم ماشینی استفاده می‌کند تا متنهایی که به صورت پرینت‌شده یا دست‌نوشته بر روی کاغذهای معمولی در اختیار داریم را به متنهای قابل ویرایش توسط نرم‌افزارهای ادیتور متن با کامپیوتر بدل نمایند.
معمولاً از OCR در زمانهایی استفاده می‌شود که فرصت زیادی برای تایپ کردن متون وجود ندارد و شما می‌خواهید به سرعت متنی را که به شکل دست‌نوشته با قلم یا خودکارهای معمولی روی کاغذ نوشته‌اید، اسکن کنید تا بتوانید آن را به شکلهای مختلف، ویرایش متنی نمایید.
یکی دیگر از کاربردهای فناوری تشخیص بصری حروف در زمانی است که شما می‌خواهید متن مقالات، کتابها یا نوشته‌های از قبل پرینت‌شده‌یی را اسکن و مجدداً ویرایش و ارسال کنید که حجم زیادی دارند و ذخیره‌سازی آنها در قالب فایلهای تصویری مثل JPEG یا GIF امکانپذیر نیست.
نرم‌افزارهای جدید OCR که غالباً از آنها در گوشی‌های تلفن همراه یا کامپیوترهای قابل حمل مجهز به صفحه‌های لمسی و Padهای نوشتار با قلم نوری استفاده می‌شود، امکانی برای تمرین کردن دارند به این معنی که هر کاربر جدید، در مدت زمانی خاص متونی مشخص‌شده را با دست‌خط خود می‌نویسد و از طریق اسکنر یا Touch Pad به نرم‌افزار ارسال می‌کند تا سنسورهای مصنوعی و نرم‌افزاری بصری، با این دستخط آشنا شوند و بتوانند همواره آن را درک کنند.
مطمئناً ماشین یا کامپیوتر به عنوان یک دستگاه صرف، دارای هوش و ادراک انسانی نیست و نمی‌تواند متنهایی که به صورت دست‌خط به او داده می‌شود را درک کند. ضمن اینکه کامپیوتر، تمامی تصاویر ذخیره‌شده با فرمتهای تصویری مثل Gif را تنها به عنوان یک تصویر می‌شناسد و هیچگاه محتویات آن را برای ویرایش درک نمی‌کند. به همین رو نیاز است تا در صورتی که از آن برای تشخیص دستخظ انسانی استفاده می‌شود، به مدتی خاص تحت تمرین قرار بگیرد.
نمونه‌ی این تمرین برای افزایش هوش مصنوعی کامپیوتر را در مجموعه‌ی تازه ارایه‌شده‌ی Office ۲۰۰۳ می‌توانیم بیابیم جایی که در نرم‌افزارهایی مثل Word شما می‌توانید فرمانهای صوتی را برای اجرای دستورهای و توابع مختلف به نرم‌افزار بدهید. برای این کار و افزایش بازدهی عملگر فرمان صوتی که بتواند دقیقتر و با درصد خطای کمتری کلام شما را متوجه شود، بخشی با عنوان Speech Training وجود دارد که در آن شما متنهای مشخصی را با صدای خودتان برای نرم‌افزار می‌خوانید و حافظه‌ی مجازی نرم‌افزار نیز فرکانسها و بسامدهای صدای شما را ذخیره می‌کند و هر لغت جدیدی را که شما ادا کنید، بدون مشکل تشخیص می‌دهد.
با این تفاسیر می‌توانیم خلاصه اینگونه جمع‌بندی کنیم که OCR برای تبدیل کردن تصاویر محو و مبهم به متنهای قابل درک و ویرایش مورد استفاده قرار می‌گیرد و اشکال گرافیکی را به کدهای ASCII و Unicode تبدیل می‌کند به شکلی که فونت، سایز، استیل، صفحه‌آرایی و تمام مختصات پاراگرافی آنها قابل ویرایش باشد.

● تاریخچه

در سال ۱۹۲۹ برای نخستین بار، گوستاو توشچک از آلمان، امتیازی برای اختراع خود با نام OCR دریافت کرد و از همان زمان، استارت طراحی نرم‌افزارهای هوشمند درک متن را زد.
اختراع او، یک دستگاه اسکنر نوری بود که یک سری الگوهای متنی آماده را در خود ذخیره می‌کرد و متنهایی که دریافت می‌نمود را در صورت تطابق کامل و تشابه بدون کم و کاست با الگوی ابتدایی ذخیره‌شده، درک می‌کرد و به کامپیوتر می‌داد. ایراد اختراع او این بود که یک نمونه‌ی از پیش تهیه‌شده شامل شکل کوچک و بزرگ حروف الفبا در اختیار داشت و در صورتی که متن ارایه‌شده به دستگاه کوچکترین تفاوتی با الگو و نمونه‌ی آماده داشت، قادر به تشخیص نبود. با این حال، این کار سرآغاز ارایه‌ی اختراعاتی شد که در آینده به تولید نرم‌افزارهای هوشمند تشخیص متن منجر شدند. در حال حاضر، این نرم‌افزارها برای درک متون تصویری به زبانهای مختلف طراحی شده‌اند و نمونه‌های جدید آنها بر روی بسیاری از گوشی‌های تلفن همراه نصب شده است.
اساس و پایه‌ی کار قلمهای نوری یا Light penهایی که همراه با برخی گوشی‌های تلفن همراه ارایه می‌شوند نیز همین فناوری است. زمانی که شما برای تایپ کردن متن یک پیام کوتاه یا شماره‌گیری کردن، بدون در اختیار داشتن هیچ کیبوردی تنها به نوشتن معمولی اعداد و حروف با دستخط خاص خودتان مبادرت می‌کنید، یعنی در حال استفاده از ثمرات OCR هستید به شکلی که یک صفحه‌ی کریستال مایع هوشمند به کمک قلم نوری، امکان درک و ردیابی کردن خطوط به ظاهر بی‌معنی ترسیم‌شده توسط شما را فراهم می‌کند.
در سال ۱۹۵۰ دومین نمونه‌ی نرم‌افزار تشخیص خط بصری کاراکترها توسط دیوید شپارد از سرویس جاسوسی سازمان نیروهای مسلح ایالات متحده طراحی شد. شپارد که متخصص رمزشکنی و باز کردن قفلهای مخفی اطلاعاتی و متنی بود، با همکاری یک پروفسور ژاپنی، نمونه‌یی از نرم‌افزار نوین OCR را طر احی کرد که نیازی به الگوی ثابت از پیش‌تعیین‌شده نداشت و به راحتی می‌توانست دست‌خطهای افراد مختلف را درک کند. ویژگی این نرم‌افزار، فهمیدن و درک کردن راحت متنهایی بود که بسیار کم‌رنگ یا توسط مداد نوشته شده بودند و یا بر اثر گذشت زمان، از وضوحشان کاسته شده بود. در آن زمان، به دلیل وجود نداشتن نرم‌افزارهایی مثل Adobe Photoshop که بتوانند وضوح و contrast تصاویر را تنظیم کنند، بالا بردن کیفیت و ترمیم تصاویر قدیمی، تار و محوشده بسیار سخت بود و به آسانی انجام نمی‌گرفت.
همچنین سرویس پستی ایالات متحده، از سال ۱۹۵۶ شروع به استفاده از OCR کرده تا بتواند امور مربوط به ارسال و دریافت نامه‌های خود در سراسر دنیا را ساماندهی نماید. با استفاده از فناوری تشخیص بصری متن، ادارات پست سراسر آمریکا به جای وارد کردن دستی یا تایپ اطلاعات مربوط به هر نامه، پاکتها و بسته‌های پستی را اسکن می‌کنند و اطلاعات مورد نیاز نیز به شکل خودکار توسط کامپیوتر فهمیده و ذخیره می‌شود. یاکوب رینبو، نخستین کسی بود که این سیستم را وارد ادارات پست و بانکهای آمریکایی کرد.
در حال حاضر هرچند نرم‌افزار رسمی و معتبری برای درک متون به زبانهای آسیای غربی و برخی زبانهای غیرلاتین‌دیگر وجود ندارد، اما جدیدترین حوزه‌ی تحقیق و گسترش نرم‌افزارهای OCR برای تشخیص حروف چسبان و شکسته‌ی لاتین است. در حال حاضر برای اکثر زبانهایی مانند فرانسوی، ایتالیایی، انگلیسی، آلمانی و... که از الفبای لاتین استفاده می‌کنند، نرم‌افزار تشخیص بصری کاراکترها وجود دارد و اشکالات رایج در آنها به دلیل وجود تفاوت در املای برخی از کلمات یا تفاوت الفبا نیز حل شده است. به همین دلیل کارشناسان، به این حوزه روی آورده‌اند که نرم‌افزارها را قادر سازند حروف چسبان، شکسته و خوشنویسی را درک کنند.
گفته می‌شود برخی از شرکتهای نرم‌افزاری در کشور ما نیز مشغول طراحی نرم‌افزار OCR فارسی هستند با این حال به نظر می‌رسد پیچیدگی‌های خاص موجود در نوشتار و الفبای فارسی و تعدد سبکهای نوشتاری فارسی برای اشخاص مختلف که حروف گوناگون را به اشکال متنوع تحریر می‌کنند، این کار تا مدتهای زیاد نیاز به تحقیق و مطالعه داشته باشد.


--------------------
نویسنده:کوروش ضیابری