[Project-ideas] [Wikimedia-BD] [Wikipedia-BN] বাংলা ওসিআর

Jayanta Nath jayantanth at gmail.com
Sun May 25 01:45:22 PDT 2014


@হাসিব, ধন্যবাদ, আসলে প্রথম আলো ছাড়া প্রায় সব সংবাদপত্রে খবরটা থাকাতে আমার
প্রথমে সন্দেহ হয়েছিল, এটা পেইড নিউজ কিনা। এখন বোঝাই যাচ্ছে আসল ঘটনা। সত্যিই
কোনো ঠিকঠাক কাজ হলে তোমার কাছে খবরটা আসত আগে। যাই হোক দেখা যাক অনেক বাংলা
ওসিআর ( Bengali OCR) প্রকল্পের মত এটাও শুধু খবর হয়ে থাকবে , নাকি বাস্তবের
মুখ দেখবে, সেটা ভবিষ্যতই  বলবে। তোমার রিপোর্টের অপেক্ষায় থাকবো।

@ মইনুল, তোমার কথার সপক্ষে অনেক কথাই বলতে হয়, কিছু কথা এখানে সেয়ার করা
দরকার বলেই মনে করি, কারন কথাগুলো এখানে পাবলিকলি থাক সবাই দেখুক, বা জানুক
বাংলা কম্পিউটিং এর বর্তমান কি অবস্থা, অবশ্যই  বাংলা ওসিআর ( Bengali OCR)
প্পরিপেক্ষিতেই কথাগুলি বলা।  আমি ভুল হতে পারি তবে আমার জানা মতে বাংলা ওসিআর
( Bengali OCR)  প্রথম ওপেন সোর্স প্রকল্পে কাজ শুরু করে অঙ্কুর  গ্রুপ [2]
[3]।  বাংলা ওসিআর ( Bengali OCR) এর প্রয়োজনীয়তা  আমরা সবাই অনুভব করছি ও করে
চলেছি। বাংলা কম্পিউটিং এর ক্ষেত্রে এটা এক পরিচিত সমস্যা। এখনো পর্যন্ত বাংলা
লিপির প্রামান্য ওসিআর নেই। এটা বাংলার জন্য দুর্ভাগ্যের। এমন কি ভারতীয় কোন
ভাষায় ওসিআর নেই। জানি এটি অনেক গবেষণার ব্যাপার। তবে কিছু কিছু জায়গায়
ওসিআর তৈরির কাজ হয়েছে ও হচ্ছে। প্রামান্য ওসিআর কবে পাওয়া যাবে সেই
ব্যাপারে আমার কিছু বলার নেই, তবে ইংরেজি লিপি নিয়ে অনেক গবেষণা হয়েছে বলেই
ওসিআর তৈরির কাজটা সহজ হয়েছিল, বাংলার ক্ষেত্রে তেমন কোনো গবেষণা হচ্ছে বলে
আমার জানা নেই। বাঙালি বা বাংলার বিশ্ববিদ্যালয় এই ব্যপারে এগিয়ে আসলেই তবে
সম্ভব হবে। বাংলার বিশ্ববিদ্যালয় গুলি  বা আপামর বাঙ্গালী জাতি নিজের ভাষা বা
লিপি সম্পর্কে খুবই উদাসিন। বাংলা লিপির উপর কয়জন পিএইচ ডি করে আমার জানা
নেই। আর এখন তো কপি পেস্টের যুগ, ছাত্ররা থিসিস লেখে উইকিপিডিয়া থেকে কপি
পেস্ট করে। এতো বছরেও বাঙ্গালিরা একটা  বাংলা ওসিআর  সফটওয়্যার *তৈরি* করতে
পারলো না। এটা খুব বেদনার।

অঙ্কুর  গ্রুপের  বাংলা ওসিআর ( Bengali OCR) প্রকল্পের  কি অবস্থা  আজ ও আমার
জানা নেই। অঙ্কুর  মুক্ত  সফটওয়্যার গ্রুপের কেউই  এই বিষয়ে মেইলের উত্তর দেয়
না। [4]  ব্যাবহার করে দেখার মত কোনো EXE বা BIN কিছুই নেই বা পাওয়া যায় না।
কোথায় আছে কেউ সন্ধান দেয় না।

ভারতেও সরকারি ভাবে কি হচ্ছে  তাদের অয়েব সাইট থেকে জানা যায়, কিন্তু কোনও
অশ্বডিম্ব পাওয়া যায়নি।  যেমন সিড্যাক [1] বা ভাষা প্রযুক্তি গবেষণা পরিষদ
[1]। আর সাথে রয়েছে ভারতের দুর্নীতি,  বাংলা ওসিআর ( Bengali OCR) তৈরি করবে
বলে টাকা নিয়ে  Indian Statistical Institute এর কোনো এক অধিককর্তা নাকি
কেন্দ্রীয়
সরকারের কোটি কোটি টাকা মেরে দিয়েছে, কিন্তু  বাংলা ওসিআর ( Bengali OCR)
পাওয়া যায় নি। [7]

যাই হোক ২০০৯ সালের শেষ দিকে  বাংলাদেশের ব্রাক ইউনিভার্সিটির একটা
প্রোজেক্ট  সেন্টার
ফর রিসার্চ অন বাংলা লেংগুয়েজ প্রসেসিং (সিআরবিএলপি ) থেকে একটি  বাংলা ওসিআর
( Bengali OCR) তৈরি করেছিল। [5] এটা ওপেন সোর্স গুগুল কোডে  [6]  রাখা আছে,
যা  আমিও ব্যবহার করি , তুমিও দেখতে পারো। যেটার কথাই তুমি বলছিলে। এটাকে আমি
বাংলা উইকিসংকলনেও পরীক্ষামুলক ভাবে ইন্সস্টল করেছি। ঐ প্রকল্পের মূল
ডেভপলারের সঙ্গেও আমি নিয়মিত যোগাযোগ রেখে চলেছি। কিন্তু, শেষ মেইল অনুসারে
মূল ডেভপলার  হাসনাত  নিজের ব্যাক্তিগত কাজের চাপের জন্য এই কাজটা এগিয়ে নিয়ে
যেতে পারছে না। এখন ও পর্যন্ত আমার জানামতে এটাই এখন মোটামুটি প্রামান্য বাংলা
ওসিআর ( Bengali OCR) যা প্রায় ৩০০ ডিপিয়াই  ভাল স্ক্যানের ক্ষেত্রে ৭০% কাজ
করে।


 <https://en.wikipedia.org/wiki/Template:OCR>1)http://ocr.cdacnoida.in/,
http://www.cdac.in/html/press/archives/atjp02/prs_rl114.aspx,
2)https://en.wikipedia.org/wiki/Ankur_Group
3) http://www.ankur.org.bd/wiki/Home
4)
http://lists.ankur.org.in/pipermail/project-ideas-ankur.org.in/2014-February/000424.html
5)
http://www.panl10n.net/center-for-research-on-bangla-language-processing-crblp-bangladesh/
6)https://code.google.com/p/banglaocr/
7)http://ddts.randomink.org/blog/?p=17
8)http://crblpocr.blogspot.in/



2014-05-19 10:46 GMT+05:30 Mayeenul Islam <wz.islam at gmail.com>:

> এরও বহু বছর আগে একুশে টেলিভিশনের সর্বময় বাংলা ঘরাণার একটি প্রতিবেদনে
> বাংলার উপর অনেকগুলো কাজের একটা হিসেবে ব্র্যাক বিশ্ববিদ্যালয়ের ছাত্রদের করা
> একটা ওসিআর-এর কাজের ব্যাপারে জানি। কিন্তু ওটারও আর কোনো আপডেট পাইনি। [?]
> অপেক্ষায় আছি...
>
> *Mayeenul Islam*
> *Front-end Designer & WordPress Developer*
> [image: http://nanodesignsbd.com/] <http://nanodesignsbd.com/>
> email: wz.islam at gmail.com
> blog: nishachor.com
> *Bangla Wikipedia* Editor<http://bn.wikipedia.org/wiki/ব্যবহারকারী:Mayeenul_Islam>|
> Founding member of Wikimedia Bangladesh<http://bd.wikimedia.org/wiki/নির্বাহী_পরিষদ>
>
>
>
> 2014-05-19 11:03 GMT+06:00 Nurunnaby Chowdhury <nh at nhasive.com>:
>
>> জয়ন্ত দা,
>> এটার আর কোন আপডেট নেই। উদ্যোক্তারা এখনও পুরোপুরি চালুর তারিখও জানাতে
>> পারেননি। তবে কাজ চলছে। কাজ চলা অবস্থায়ই নিউজ হয়ে গেছে!
>>
>>
>> 2014-05-19 0:17 GMT+06:00 Jayanta Nath <jayantanth at gmail.com>:
>>
>>> প্রিয় সবাই,
>>>
>>> কয়েকদিন আগে বাংলাদেশের অনেক সংবাদ মাধ্যমে বাংলা ওসিআর সংক্রান্ত একটি খবর
>>> প্রকাশিত হয়েছিল, এই খবরের শেষ কোনো আপডেট কেউ দিতে পারেন?
>>>
>>> http://www.dbarta.com/?p=13646
>>> http://www.dhakatimes24.com/2014/03/12/17661
>>> http://www.kalerkantho.com/feature/techbishaw/2014/04/02/68179
>>> http://www.ittefaq.com.bd/index.php?ref=MjBfMDVfMThfMTNfMV8xOF8xXzQxNDky
>>> http://www.alokitobangladesh.com/development-possibility/2014/04/02/63386
>>> http://tm-engine.com/project-research.php
>>>
>>> জয়ন্ত
>>>
>>> _______________________________________________
>>> Wikipedia-BN mailing list
>>> Wikipedia-BN at lists.wikimedia.org
>>> https://lists.wikimedia.org/mailman/listinfo/wikipedia-bn
>>>
>>>
>>
>>
>> --
>> *Nurunnaby Chowdhury Hasive*
>> Administrator | Bengali Wikipedia<http://bn.wikipedia.org/wiki/user:nhasive>
>> Member | IEG Committee, Wikimedia Foundation<https://meta.wikimedia.org/wiki/Grants:IdeaLab/People>
>> Social Media Interaction Expert | The Daily Prothom-Alo<http://www.prothom-alo.com>
>> Bangladesh Ambassador | Open Knowledge Foundation Network
>> <http://www.okfn.org>
>> Treasurer | Bangladesh Open Source Network (BdOSN) <http://www.bdosn.org>
>> Task Force Member | Mozilla Bangladesh <http://www.mozillabd.org>
>> fb.com/nhasive | @nhasive <http://www.twitter.com/nhasive> | Skype:
>> nhasive | www.nhasive.com
>>
>> _______________________________________________
>> Wikimedia-BD mailing list
>> Wikimedia-BD at lists.wikimedia.org
>> https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd
>>
>>
>
> _______________________________________________
> Wikimedia-BD mailing list
> Wikimedia-BD at lists.wikimedia.org
> https://lists.wikimedia.org/mailman/listinfo/wikimedia-bd
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.ankur.org.in/pipermail/project-ideas-ankur.org.in/attachments/20140525/a5b5a059/attachment-0001.htm>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: image/png
Size: 612 bytes
Desc: not available
URL: <http://lists.ankur.org.in/pipermail/project-ideas-ankur.org.in/attachments/20140525/a5b5a059/attachment-0001.png>


More information about the Project-ideas mailing list