|
نرمافزار (یا ماشین)های خواندن خودکار، زمینههای کاربردی بالقوهی زیادی دارند. یکی از موفقترین کاربردها در این زمینه، تبدیل کتابها یا اسناد اسکن شده به فایلهای متنی و تصاویر میباشد. از نتیجهی این کار میتوان در کتابخانههای دیجیتال یا دفاتر خودکار شده استفاده کرد. کاربردهای دیگر آن شامل مرتب کردن چکها در بانکها، خواندن آدرس بستههای پستی و مرتب کردن خودکار مراسلات، کمک به خواندن افراد نابینا، ارتباط بین انسان و ماشین با استفاده از خودکار، و بسیاری کاربردهای دیگر میشود.
بازشناخت حروف بصری (OCR) یکی از شاخههای بازشناخت الگو است که در آن خواندن خودکار متون مورد مطالعه قرار میگیرد. هدف نهایی OCR رسیدن به توانایی انسان در خواندن متون با سرعت زیاد از روی تصاویر متون است. تا کنون سیستمهای بسیاری برای بازشناخت حروف در زبانهای انگلیسی، عربی و بسیاری زبانهای دیگر توسعه داده شده است، ولی هیچ سیستم قابل استفاده و صنعتی برای بازشناخت حروف فارسی موجود نیست. با وجود این که زبان عربی شباهت زیادی به زبان فارسی دارد، ولی به دلیل تنوع فونتهای فارسی نسبت به عربی، محصولات تجاری عربی موجود نظیر Sakhr یا Iris را نمیتوان به نحو کارایی مورد استفاده قرار داد.
سپنتا اولین شرکتی است که یک سیستم صنعتی برای بازشناخت حروف فارسی توسعه داده است. سیستم مذکور در حال حاضر تصاویر درون متن را از شناسایی و از متن اطراف جدا میکند. بنابراین میتوان از آن برای خواندن تصاویر موجود در کتابهای معمولی و روزنامهها به نحو کارایی استفاده کرد. همچنین میتوان از آن به عنوان یک جزء تکمیل کننده در مجموعهی اتوماسیون اداری استفاده کرد. |