<div dir="ltr"><br><br><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">NAGASHREE S.BHAT</b> <span dir="ltr"><<a href="mailto:nagashreesbhat@gmail.com">nagashreesbhat@gmail.com</a>></span><br>
Date: Sun, May 19, 2013 at 4:03 PM<br>Subject: Re: Implementation plans with weekly deadlines<br>To: <a href="mailto:bhavi@ubuntu.com">bhavi@ubuntu.com</a><br><br><br><div dir="ltr"><p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline">
<b><span lang="EN" style="font-size:12pt;font-family:Arial,sans-serif">Hello Sir ,</span></b></p><p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline">
<span lang="EN" style="font-size:12pt;font-family:Arial,sans-serif">This is reply to the feedback on GSOC Speech Based Query and Result Retrieval system for Indian Languages</span></p><p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline">

<span lang="EN" style="font-size:12pt;font-family:Arial,sans-serif"><b>- </b>the feedback was  Could you please elaborate on the implementation plans to have along with the weekly deadlines<b> </b></span></p><p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline">

<span lang="EN" style="font-size:10pt;font-family:Arial,sans-serif"><br></span></p><p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-size:10pt;font-family:Arial,sans-serif">Since my mother tongue is Kannada, I have been into this
language from birth, but it saddens me as to how this language is not known to
many. By doing this project I want to make everyone aware of Kannada. And also
I have noticed that there is no speech based query (speech recognition) </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-size:10pt;font-family:Arial,sans-serif"> Many people
require writing in Bengali different things daily. To them it will be perfect.
Just they need to use this keyboard to type in Bengali and bingo, they get it!!</span><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif"></span></p>

<p style="text-align:justify"> </p>

<p><b> </b></p>

<p><b>Implementation Plans
with weekly deadlines</b></p>

<p>Since my college will be off from 9<sup>th</sup> July to 30<sup>th</sup>
July I will be at home and will be able to give whole time from morning 9.00 to
evening 6.00 and once my college starts I will be able to give time every day
from 5.00 to 9.00 in evening and Sundays and other holidays from 9.00 to 5.00
.I feel this is pretty enough time to give for the project</p>

<p>As of now my exams will be starting from 17<sup>th</sup>
June and ends at 8<sup>th</sup> July I won’t be able to concentrate much on the
project. But as soon as my exam completes I will give my 100% to the project.</p>

<p> </p>

<p><b>Regarding the
project:</b></p>

<p> </p>

<p>I’m doing some impromptu research on this topic of speech
based query and result retrieval </p>

<p>I got to know that there is no proper stt to tts conversion not
only for Kannada but also to many other Indian Languages</p>

<p>I want to create a framework under Linux os so that it takes
speech as a query and processes the speech and gives the result</p>

<p>Kannada is an agglutinative and inflectional language. Hence
the query needs to be processed using morphological analyzer or stemmer to
obtain the base forms of the given query terms. It accepts the given input
string and performs a database lookup operation to check whether the given
query is directly present in the bilingual dictionary. If not present, the
query is undergone transliteration process. The dictionary has to be built from
scratch if no resources is available for this domain</p>

<p>Kannada is a subject-object-verb (SOV) language. In this
type, subject, object and verb appear in that order. English is
subject-verb-object (SVO) language. The system focuses on machine translation
technique rather than word to word translation. The machine translation
involves parts of speech (POS) tagging should be done for all words in the
dictionary. A local word recording is done based on POS tagging to obtain SVO
pattern of English query.</p>

<p>Then, the text retrieval module searches the collection for
documents relevant to the transcription, and outputs a specific number of top
ranked documents according to the degree of relevance, in descending order</p>

<p> </p>

<p><b>Usage of ontological
tree:</b> Each keyword identified is matched with every node in ontological
tree. The exact location if the keyword in the tree is identified.</p>

<p>The language which is most appropriate to the keyword is
traced with the help of the attribute set in that node and the language of the
document search is identified.</p>

<p>All the child nodes of the keyword are traversed and their
corresponding entries in the above decided language are noted as related data
for document search.</p>

<p style="margin:0in 0in 0.0001pt 0.25in;line-height:14.25pt;vertical-align:baseline"><b><span lang="EN" style="font-size:12pt;font-family:Arial,sans-serif">     
</span></b><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif"></span></p>

<p style="margin:0in 0in 0.0001pt 0.25in;line-height:14.25pt;vertical-align:baseline"><b><span lang="EN" style="font-size:12pt;font-family:Arial,sans-serif">Tentative
Timeline/Phases/milestones (<span style="background-color:rgb(246,246,246)">in weekly
intervals until the end of GSoC</span>):</span></b><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif"></span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><b><span lang="EN" style="font-size:12pt;font-family:Arial,sans-serif">           
</span></b><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif"></span></p>

<p style="margin:0in 0in 0.0001pt 56.25pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-size:10pt;font-family:Symbol">·</span><span lang="EN" style="font-size:7pt;font-family:'Times New Roman',serif">    </span><span lang="EN" style="font-family:'Times New Roman',serif">April 22<sup>nd</sup> –May 22<sup>nd</sup>
(30 days) - Submitting the proposal</span></p>

<p style="margin:0in 0in 0.0001pt 56.25pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">May 27<sup>th</sup>-June
17<sup>th </sup>(22days) - Bonding with the community more and more. Going
through the implementation details and bit of impromptu research on speech
recognition technique, how the microphone, speakers and soundcard synthesizes
the sound and how it produces the sound.</span></p>

<p style="margin:0in 0in 0.0001pt 0.5in;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:'Times New Roman',serif">Which tools and technologies to be used
either openAL or webAudio or the native c++ or Java.</span></p>

<p style="margin:0in 0in 0.0001pt 0.5in;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">June 17<sup>th</sup>
– July 8<sup>th</sup> (21days)- Semester exams but bit of coding</span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">July 9<sup>th</sup>-
July 29<sup>th</sup>(20 days) – Full on coding i.e designing the input details,
drafting some rendering rules algorithms 
and coding the algorithms for implementation</span></p>

<p><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">July 29<sup>th</sup>
– Submitting for midterm evaluation</span></p>

<p><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">August 2<sup>nd</sup>-
September 14<sup>th</sup> (44 days)– Writing and completing the whole code base
as well as the speech synthesis part of the project</span></p>

<p><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">September 15<sup>th</sup>
– September 23<sup>rd </sup>(7 days) – Fine tuning the project and doing the
documentation (Pencil’s down date).</span></p>

<p><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-bottom:0.0001pt;line-height:14.25pt;vertical-align:baseline"><span lang="EN" style="font-family:Symbol">·<span style="font-size:7pt;line-height:normal;font-family:'Times New Roman'">        
</span></span><span lang="EN" style="font-family:'Times New Roman',serif">September 27<sup>th</sup>
– Final  submission of the project to
GSOC</span></p>

<p><span lang="EN" style="font-family:'Times New Roman',serif"> </span></p>

<p style="margin-left:0.5in"><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif">During the duration of project development a rough
documentation article may be maintained to keep track of various activities and
project work-flow which can be very useful during final documentation. Coding
and debugging activities can also go on side by side to decrease excessive
workload at the time of Testing and debugging.</span></p>

<p><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif">The main goal
for Mid-Term Assessment would be completion of a working module capable of
handling speech inputs and rendering proper outputs.</span></p><p><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif"><br></span></p><p><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif"><i> </i>I hope this is satisfactory</span></p>

<p><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif">Thank you,</span></p><p><span lang="EN" style="font-size:12pt;font-family:'Times New Roman',serif">Nagashree S.Bhat</span></p>

</div>
</div><br></div>