<p class="MsoNormal"><font face="arial, helvetica, sans-serif">Hello,</font></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif">     </font></p><p class="MsoNormal"><font face="arial, helvetica, sans-serif">       I was looking
for UI testing tools, but couldn’t find any for linguistic testing. Can you list
few UI testing framework for linguistic testing. </font></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif"><br></font></p><p class="MsoNormal"><font face="arial, helvetica, sans-serif"> </font><span style="font-family:arial,helvetica,sans-serif;line-height:12.6pt">I
have a related doubt for </span><span style="font-family:arial,helvetica,sans-serif;line-height:12.6pt;background-color:white;background-image:initial">the project “</span><span style="font-family:arial,helvetica,sans-serif;line-height:12.6pt;letter-spacing:-0.45pt">An application
UI testing framework for validating translation completeness and quality”</span><span style="font-family:arial,helvetica,sans-serif;line-height:12.6pt">.
I want to know whether an approach similar to Qt Linguist (summarized below) can</span><span style="font-family:arial,helvetica,sans-serif;line-height:12.6pt;letter-spacing:-0.45pt"> be used for this project.</span></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif">Qt Linguist
maintains a context list which stores the translation status for each context
(classes). Each context has one of the four status of whether all strings in
that context have been translated or not and whether they have passed the
validation test or not.</font></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif">Now, each
string passes four kinds of validation tests: <span style="background:white">Accelerator validation, Punctuation validation, Phrases
validation and Place marker validation. So, the context list helps in
maintaining a record of the translation completeness and quality (through validation
tests). </span></font></p>

<p class="MsoNormal"><span style="background-image:initial;background-color:white;background-repeat:initial initial"><font face="arial, helvetica, sans-serif"> </font></span></p>

<p class="MsoNormal"><span style="background-image:initial;background-color:white;background-repeat:initial initial"><font face="arial, helvetica, sans-serif">I also need some feedback on features of localization
tools, which I am mentioning below. Please correct me or add if I am missing
something.</font></span></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif">I have looked
into few of localization tools including gettext, Gtranslator, Lokalize,
Virtaal and Qt Linguist. Though most of the features are common among all the localization
tools (with slight variation in their usuability), couple of them offer
remarkable features. </font></p>

<p class="MsoListParagraphCxSpFirst" style="margin-left:47.5pt"><font face="arial, helvetica, sans-serif">·     Lokalize
has some features like: Sync capabilities, Project Overview manager, is extendible
(using scripts), Glossary, and also has a good interface. The
paragraph-by-paragraph translation for documentation and msg-by-msg translation
for GUI msgs is a good approach.  </font></p>

<p class="MsoListParagraphCxSpMiddle" style="margin-left:47.5pt"><font face="arial, helvetica, sans-serif">·    Virtaal
on the otherhand also has some cool features like Auto-completion and
auto-correction. Its translation memory uses Machine translation through Apertium, Google Translate and Moses.</font></p>

<p class="MsoListParagraphCxSpLast" style="margin-left:47.5pt"><font face="arial, helvetica, sans-serif">·     Qt
Linguist also has many great features Phrase book (Glossary), simultaneous multiple
language translation (though not required) and powerful completeness validation
scheme, but it is restricted to Qt applications (ts file).</font></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif">Thanks a lot.</font></p><p class="MsoNormal"><font face="arial, helvetica, sans-serif"><br></font></p><p class="MsoNormal"><font face="arial, helvetica, sans-serif">Regards,</font></p>
<p class="MsoNormal"><font face="arial, helvetica, sans-serif">Nitesh Surtani</font></p><p class="MsoNormal"><font face="arial, helvetica, sans-serif"><br></font></p>

<p class="MsoNormal"><font face="arial, helvetica, sans-serif">  </font></p><div class="gmail_quote">On Thu, Mar 22, 2012 at 3:00 PM, nitesh surtani <span dir="ltr"><<a href="mailto:nitesh.surtani0606@gmail.com">nitesh.surtani0606@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p class="MsoNormal">Hello,</p>

<p class="MsoNormal"> </p>

<p class="MsoNormal">      I am Nitesh Surtani,
a 4<sup>th</sup> year dual-degree student from IIIT-Hyderabad. I am pursuing my
MS in Natural Language Processing. I have been working on language processing
for around 2 years now and I am well equipped with many tools and concepts in
this field. Though I am not very familiar with localization and internationalization,
as I have not worked on it now, but I am very much interested in working on
such a project. I have good programming skills.</p>

<p class="MsoNormal"><br></p><p class="MsoNormal">I will be able to commit 6 hrs/day or around 40hrs/wk for
the project. </p><p class="MsoNormal"></p><p class="MsoNormal"><br></p><p class="MsoNormal">Relevant Courses Completed:</p>

<p class="MsoNormal" align="left" style="text-align:left;text-indent:0in;text-autospace:none">NLP: Artificial Intelligence, Machine
Learning, Natural Language Processing, NLP Applications: IE and MT,
Computational Linguistics, Pattern Recognition, Time and Event in Discourse.</p>

<p class="MsoNormal" style="text-indent:0in">Programming: C, C++, Java, Python, Php</p>

<p class="MsoNormal" align="left" style="text-align:left;text-indent:0in;text-autospace:none"> </p>

<p class="MsoNormal" style="text-indent:0in">I am also attaching my resume for
further reference.</p><p class="MsoNormal" style="text-indent:0in"><br></p><p class="MsoNormal" style="text-indent:0in"></p><p class="MsoNormal" style="text-indent:0in">Projects
Interested In: </p>

<p class="MsoNormal" align="left" style="margin-bottom:7.0pt;text-align:left;text-indent:0in;line-height:12.6pt;vertical-align:baseline"><span style="letter-spacing:-0.45pt">1) An application UI testing framework for
validating translation completeness and quality</span></p>

<p class="MsoNormal" align="left" style="text-align:left;text-indent:0in;vertical-align:baseline">Mentor: <a href="https://fedoraproject.org/wiki/User:Runab" target="_blank"><span style="text-decoration:none">Runa Bhattacharjee</span></a></p>



<p class="MsoNormal">Though I am not very familiar
will l10n, but I am very keen to explore this project. I have looked into the
localization of a couple of software in Hindi (I wasn’t able to understand the
UI in Bengali <span style="font-family:Wingdings">J</span>). I have gone through the translations for Pidgin for
Hindi (<a href="http://developer.pidgin.im/ticket/11411" target="_blank"><span style="text-decoration:none">http://developer.pidgin.im/ticket/11411</span></a>) and have understood few
issues. I have a doubt though: Since I am not a Bengali speaker, will it affect
my understanding and working on this project.</p>

<p class="MsoNormal"> </p>

<h4 style="margin-top:0in;margin-right:0in;margin-bottom:7.0pt;margin-left:0in;line-height:12.6pt;vertical-align:baseline"><span style="font-size:11pt;font-family:Calibri,sans-serif;letter-spacing:-0.45pt;font-weight:normal">2) Add a
language model for speech recognition software for Bengali language</span></h4>

<p style="margin-top:0in;margin-right:0in;margin-left:0in;margin-bottom:0.0001pt;vertical-align:baseline;border-style:initial;border-color:initial"><span style="font-size:11pt;font-family:Calibri,sans-serif">Mentor:<span> </span><a href="http://www.mit.edu/~sdg1/" style="border-style:initial;border-color:initial;font-style:inherit" target="_blank"><span style="text-decoration:none;padding:0in;border:none windowtext 1.0pt">Sayamindu Dasgupta</span></a></span></p>



<p class="MsoNormal">I actually wanted some more
insight regarding this project. Since the corpus is available, some HMM modeI
(like HTK toolkit, usually used for speech recognition) can be used to implement
this language model. I have used SRILM toolkit once for MT task as part of the
course project to develop a domain-specific MT system for tourism domain. </p>

<p class="MsoNormal"> </p><p class="MsoNormal"><span style="text-indent:0in">Thanks a lot,</span></p><p class="MsoNormal">Nitesh Surtani</p><p></p><p></p>
</blockquote></div><br>