ورود

نسخه کامل مشاهده نسخه کامل : سوال در مورد Ocr فارسي



javad2625
13-12-2007, 21:13
سلام

من نرم افزار OCR فارسي رو به نام Red I.R.I.S دارم. اون رو امتحان كردم. قدرت تشخيص كاراكتر اين نرم افزار بستگي به نوع و اندازه فونتي كه استفاده كرديم داره. اما روي هم رفته در هر خط از متني كه OCR مي كنه اينقدر غلط داره كه اگه خودم تايپ كنم خيلي سريعتر ميشه.

خواستم بپرسم راهي هست كه با كاليبره كردن و به اصطلاح Train كردن نرم افزار، به تدريج قدرت تشخيص اون رو بالا ببريم؟ يا نرم افزار بهتري براي اين كار وجود نداره؟

متشكرم

علی علی علی
28-12-2007, 17:00
چون زبان فارسی کمترین کاربرد رو در مسائل فناوری داره واسه همین مورد توجه کسی واقع نمیشه و این نرم افزارهای دست و پا شگسته هم کارایی لازم رو ندارن من که میگم از خیرش بگذر تا یه فرجی تو این زبون در رایانه بوجود بیاد.(در یک کلام خودتو خسته نکن)

mohsen_sir
29-12-2007, 11:31
زبون فارسي هر حرفش توي كممه مكننه چندين حالت داشته باشه بره همين تشخيص حروف بره كامپيوتر مشكله ضمناً شما مي تونيد يه سري فونت به نرم افزارتون اظافه كنيد تا دقتش بره بالا به هر حال از خيرش بگذر .

aliali58
11-01-2008, 02:12
سلام

من نرم افزار OCR فارسي رو به نام Red I.R.I.S دارم. اون رو امتحان كردم. قدرت تشخيص كاراكتر اين نرم افزار بستگي به نوع و اندازه فونتي كه استفاده كرديم داره. اما روي هم رفته در هر خط از متني كه OCR مي كنه اينقدر غلط داره كه اگه خودم تايپ كنم خيلي سريعتر ميشه.

خواستم بپرسم راهي هست كه با كاليبره كردن و به اصطلاح Train كردن نرم افزار، به تدريج قدرت تشخيص اون رو بالا ببريم؟ يا نرم افزار بهتري براي اين كار وجود نداره؟

متشكرم

جواد جان با حداكثر dpi ممكن اسكن كن و سعي كن تا حد ممكن كاغذي رو كه براي اسكن ميذاري نسبت به اسكنر كاملا صاف قرار بگيره (نميدونم متوجه منظورم شدي يا نه يه مثال برات ميزنم فرض كن صفحه اسكنر يه مستطيل هست حالا كاغذ آ 4 كه يه مستطيل ديگه هست رو طوري توي اون قرار بده مثل اينكه مستطيل اول رو كوچيك تر كردي و به اون ابعاد رسيدي يعني كاغذ توي اسكنر كج قرار نگيره) اينجوري تعداد غلط ها كمتر ميشه

javad2625
12-01-2008, 06:31
جواد جان با حداكثر dpi ممكن اسكن كن و سعي كن تا حد ممكن كاغذي رو كه براي اسكن ميذاري نسبت به اسكنر كاملا صاف قرار بگيره (نميدونم متوجه منظورم شدي يا نه يه مثال برات ميزنم فرض كن صفحه اسكنر يه مستطيل هست حالا كاغذ آ 4 كه يه مستطيل ديگه هست رو طوري توي اون قرار بده مثل اينكه مستطيل اول رو كوچيك تر كردي و به اون ابعاد رسيدي يعني كاغذ توي اسكنر كج قرار نگيره) اينجوري تعداد غلط ها كمتر ميشه
ديگه معني صاف و كج رو كه مي فهمم چيه.
dpi هم 150 هست. همون كيفيتي كه متن انگليسي رو با دقت خيلي بالا OCR مي كنه. ولي براي فارسي، فعلاً در حد اسباب بازي هست. كاربرد جدي نداره. تا ما بيايم يه OCR فارسي طراحي و توليد كنيم، براي زبون انگليسي، نرم افزار تشخيص صدا و تشخيص دستخط هم ساخته شده.

aliali58
12-01-2008, 15:31
ديگه معني صاف و كج رو كه مي فهمم چيه.
dpi هم 150 هست. همون كيفيتي كه متن انگليسي رو با دقت خيلي بالا OCR مي كنه. ولي براي فارسي، فعلاً در حد اسباب بازي هست. كاربرد جدي نداره. تا ما بيايم يه OCR فارسي طراحي و توليد كنيم، براي زبون انگليسي، نرم افزار تشخيص صدا و تشخيص دستخط هم ساخته شده.

جواد جان قصد جسارت نداشتم اين كه گفتم كج نباشه و تأكيد كردم به خاطر اين بود كه طبق تجربه خودم خيلي تأثير داره و به خاطر اين بود كه فكر ميكردم نتونستم منظورم رو برسونم زياد توضيح دادم.

دي پي آي 150 كه خيلي كمه جواد جان يه بار با دي پي آي بالا تر امتحان كن حتما روي كجي كاغذ هم بيش از اندازه دقت كن ببين چطوره؟
من گاهي اوقات كه فونت كوچيك باشه تا دي پي آي 1200 هم اسكن ميكنم البته اين رو براي انگليسي گفتم چون تا حالا فارسي رو اسكن نكردم.