سلام دوستان
همه ما میدونیم که این بزرگترین مشکل ما ایرانی ها هست که فایل pdf فارسی رو بدون مشکل نمیتونیم تبدیل کنیم البته ocr هایی واسه این کار هست که اون ها هم باز با مشکل خروجی text میگیرن.
اصل مشکا اینجاست که متاسفانه هنگام طراحی فونت به license فونت و مسئله مهم embeding توجه نمیشه این در حالی هستش که تمامی فونت های انگلیسی این مورد رو پشتیبانی میکنند و این امر از اصلی ترین مباحث برای خروجی text گرفتن از pdf هستش.
یکی از استاد های خوب بنده بعد دو سال تلاش و کوشش برای اولین بار این موضوع رو حل کرده که من به نقل از ایشون این راه رو اینجا بیان میکنم.
ابتدا من چند تا از فونت هایی رو که مشکلشون حل شده اینجا میزارم و شما تست کنید و جواب رو اینجا ارسال کنید.
1- ابتدا فونت رو تو سیستمتون نصب کنید (اگر فونت هم نام بود قبلی رو پاک کنید بعد دوباره نصب کنید).
2- یک متنی رو تو ورد تایپ کنید و سپس از اون خروجی pdf بگیرید. (این کار رو باید با یک برنامه ای که تو قسمت پرینتر نصب میشه مثل pdf factory یا pdf995 انجام بدید یادتون نره باید تو این مرحله تیک embeding رو بزنید).
3- حالا فایل آماده شده را با برنامه adobe acrobate redaer me باز کنید و از منوی file گزینه save as text رو بزنید.
4- فایل رو ذخیره کنید و حالشو ببرید.
البته نمیدونم چرا نمیتونم فایل آپلود کنم ولی تو جای دیگه واستون آپ کردم.
یادتون نره تست کنید و جوابشو بدین
ممنون.
کد:
http://www.2shared.com/file/5477275/f1190019/fonts.html