ثبت نام    ورود به سايت
   


رمز عبورم را فراموش کرده ام
آخرین اخبار
[سه شنبه،6تیر،1385]
براي بهبود عملكرد اوسي‌آر فارسي سپنتا در برخي موارد نادر، الگوريتم‌هاي جديد محاسبه و تصحيح كجي صفحه به آن اضافه شدند. 

[یکشنبه،4تیر،1385]
نسخه جديد موتور ريشه‌ياب به خطاياب املايي سپنتا اضافه شد. 

[پنج شنبه،1تیر،1385]
ريشه‌ياب املايي سپنتا ارتقا داده شد. مجموعه‌اي از استثنائات قوانين ساخت زبان فارسي به موتور ريشه‌ياب اضافه شدند. 

  
OCR فارسی سپنتا
 

نرم‌افزار (یا ماشین)های خواندن خودکار، زمینه‌های کاربردی بالقوه‌ی زیادی دارند. یکی از موفق‌ترین کاربردها در این زمینه، تبدیل کتاب‌ها یا اسناد اسکن شده به فایل‌های متنی و تصاویر می‌باشد. از نتیجه‌ی این کار می‌توان در کتابخانه‌های دیجیتال یا دفاتر خودکار شده استفاده کرد. کاربردهای دیگر آن شامل مرتب کردن چک‌ها در بانک‌ها، خواندن آدرس‌ بسته‌های پستی و مرتب کردن خودکار مراسلات، کمک به خواندن افراد نابینا، ارتباط بین انسان و ماشین با استفاده از خودکار، و بسیاری کاربردهای دیگر می‌شود.

بازشناخت حروف بصری (OCR) یکی از شاخه‌های بازشناخت الگو است که در آن خواندن خودکار متون مورد مطالعه قرار می‌گیرد. هدف نهایی OCR رسیدن به توانایی انسان در خواندن متون با سرعت زیاد از روی تصاویر متون است. تا کنون سیستم‌های بسیاری برای بازشناخت حروف در زبان‌های انگلیسی، عربی و بسیاری زبان‌های دیگر توسعه داده شده است، ولی هیچ سیستم قابل استفاده و صنعتی برای بازشناخت حروف فارسی موجود نیست. با وجود این که زبان عربی شباهت زیادی به زبان فارسی دارد، ولی به دلیل تنوع فونت‌های فارسی نسبت به عربی، محصولات تجاری عربی موجود نظیر Sakhr یا Iris را نمی‌توان به نحو کارایی مورد استفاده قرار داد.

سپنتا اولین شرکتی است که یک سیستم صنعتی برای بازشناخت حروف فارسی توسعه داده است. سیستم مذکور در حال حاضر تصاویر درون متن را از شناسایی و از متن اطراف جدا می‌کند. بنابراین می‌توان از آن برای خواندن تصاویر موجود در کتاب‌های معمولی و روزنامه‌ها به نحو کارایی استفاده کرد. هم‌چنین می‌توان از آن به عنوان یک جزء تکمیل کننده در مجموعه‌ی اتوماسیون اداری استفاده کرد.

  
Copyright 2006 by Sepanta Software Engineering Co