Hi Abhishek,<div><br></div><div>I have some comments which I have added inline.<br><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
> My understanding of the idea is that we have to process query so that we can<br>
> get the desired result. The query may be in different languages and the<br>
> program needs to understand the query as appropriate as posssible in any<br>
> language and give the answer accordingly by searching different forums,FAQs<br>
> or articles like wikipedia. </blockquote><div><br></div><div>I feel that this approach makes this as a problem of information retrieval which it is not. This is primarily, because we should be given some data which should be processed in the pre-processing step. An example of that can be found by searching "virtual chat paypal".</div>

<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">> If the query is interpreted in right way then<br>
> there are high hopes for giving as appropriate answer as possible. Most of<br>
> the problems in query interpretation may be removal of  some unwanted words,<br>
> pointing out the key words, recognize the words in the right sense (remove<br>
> disambiguation) and recognizing the grammar of the query.<br>
>  I am interested in working for the disambiguation and noise removal in the<br>
> query. So, I would like to know how much has been done in that direction and<br>
> what can be further done???</blockquote><div>  </div><div>So, I feel that the large parts of the project might involve working on other aspects like knowledge representation of the input data, making your system to ask intelligent questions in case if it is not sure about the question (read about "interactive searches"). Disambiguation shouldn't be the primary problem because it generally involve semantic analysis and given the scope of the system like say a FAQ page of a website with about 3000 lines of input data, there shouldn't be much ambiguity within it.</div>

<div> </div><div>At the work done, we can probably follow the publications with SIRI which is a derivative of the work done in CALO (<span style="background-color:rgb(255,255,255);font-family:sans-serif;font-size:13px;line-height:19px"> </span><span style="background-color:rgb(255,255,255);font-family:sans-serif;font-size:13px;line-height:19px">"Cognitive Assistant that Learns and Organizes") </span>project. They have quite a large number of publications which can be found here - <a href="https://pal.sri.com/Plone/publications">https://pal.sri.com/Plone/publications</a>.</div>
<div></div></div><br></div><div>Best Regards</div><div>Abhishek</div><div>abhishek.cc</div>