Hi<div><br></div><div>I would like to develop a system where the query is not mapped to a pre-existing query, but where the processing is done upon the query itself in order to produce a suitable match from the data set that we are querying upon. It would be essentially like a multi-lingual search engine.</div>

<div><br></div><div>I have previously worked on a query-response system where weighted keyphrase matching was being used to retrieve the closest match from an existing data set. But that was all in English. The challenge obviously lies in building an English-Bengali system. </div>

<div>What I can think of is: If we have a data set of both English and Bengali, first step would be to determine whether the query is in Bengali or English. If it is in Bengali, no translation should be required to search in the Bengali data set. But for the English part of it, first we can translate the query to English (with a high amount of accuracy) and then search. Then the results from both languages can be combined and presented to the user. If it is in English, a similar approach can be followed.</div>

<div><br></div><div>However, existing machine translation systems aren't very accurate, and it is in fact one of the other projects in the ideas page. Should it be sufficient to develop such a system where the translation bit can be plugged in from the other project?</div>

<div>Also, I'll be very grateful for any kind of feedback on the approach that I suggested. I will be writing the formal application soon.</div><div><br></div><div>Regards<br>Sampoorna Biswas</div><div><br><br><div class="gmail_quote">

On Fri, Apr 6, 2012 at 8:10 AM, Sankarshan Mukhopadhyay <span dir="ltr"><<a href="mailto:sankarshan.mukhopadhyay@gmail.com">sankarshan.mukhopadhyay@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div class="HOEnZb"><div class="h5">On Thu, Apr 5, 2012 at 5:46 PM, Sampoorna Biswas<br>
<<a href="mailto:sampoorna10074@iiitd.ac.in">sampoorna10074@iiitd.ac.in</a>> wrote:<br>
<br>
> In the project "Develop a system with multi-lingual capabilities in order to<br>
> receive answer to user specific queries.", how exactly does one 'determine<br>
> the question'? I mean, what is the input here? Will a user query be<br>
> classified into a query that already exists and the closest match be<br>
> delivered?<br>
<br>
</div></div>The archives will have at least one email explaining some parts of the<br>
questions you have raised. I hope you have had the chance to look<br>
through them. I'd say that the system does not specifically<br>
"determine" the question. The user can use the input area to provide a<br>
string to query upon, it may be the form of a question or, it may be a<br>
fragmented word. Whether your proposal would convert the user input<br>
into a query to map to a pre-existing query is something you should<br>
look at. Earlier in the conversation with others on this project, I<br>
had mentioned that the constraints of a FAQ like system will<br>
potentially devalue this implementation.<br>
<span class="HOEnZb"><font color="#888888"><br>
<br>
--<br>
sankarshan mukhopadhyay<br>
<<a href="http://sankarshan.randomink.org/blog/" target="_blank">http://sankarshan.randomink.org/blog/</a>><br>
</font></span></blockquote></div><br></div>