File Doc Category Size Date Package
LikeThisQueryBuilder.java API Doc Apache Lucene 2.1.0 4000 Wed Feb 14 10:46:20 GMT 2007 org.apache.lucene.xmlparser.builders

LikeThisQueryBuilder

java.lang.Object

public class LikeThisQueryBuilder extends Object implements org.apache.lucene.xmlparser.QueryBuilder

author: maharwood

Fields Summary
private Analyzer
analyzer
String[]
defaultFieldNames
int
defaultMaxQueryTerms
int
defaultMinTermFrequency
float
defaultPercentTermsToMatch
Constructors Summary
public LikeThisQueryBuilder(Analyzer analyzer, String[] defaultFieldNames)
//default is a 3rd of selected terms must match this.analyzer=analyzer; this.defaultFieldNames=defaultFieldNames;
Methods Summary
public org.apache.lucene.search.Query getQuery(org.w3c.dom.Element e)
String fieldsList=e.getAttribute("fieldNames"); //a comma-delimited list of fields String fields[]=defaultFieldNames; if((fieldsList!=null)&&(fieldsList.trim().length()>0)) { fields=fieldsList.trim().split(","); //trim the fieldnames for (int i = 0; i < fields.length; i++) { fields[i]=fields[i].trim(); } } //Parse any "stopWords" attribute //TODO MoreLikeThis needs to ideally have per-field stopWords lists - until then //I use all analyzers/fields to generate multi-field compatible stop list String stopWords=e.getAttribute("stopWords"); Set stopWordsSet=null; if((stopWords!=null)&&(fields!=null)) { stopWordsSet=new HashSet(); for (int i = 0; i < fields.length; i++) { TokenStream ts = analyzer.tokenStream(fields[i],new StringReader(stopWords)); try { Token stopToken=ts.next(); while(stopToken!=null) { stopWordsSet.add(stopToken.termText()); stopToken=ts.next(); } } catch(IOException ioe) { throw new ParserException("IoException parsing stop words list in " +getClass().getName()+":"+ioe.getLocalizedMessage()); } } } MoreLikeThisQuery mlt=new MoreLikeThisQuery(DOMUtils.getText(e),fields,analyzer); mlt.setMaxQueryTerms(DOMUtils.getAttribute(e,"maxQueryTerms",defaultMaxQueryTerms)); mlt.setMinTermFrequency(DOMUtils.getAttribute(e,"minTermFrequency",defaultMinTermFrequency)); mlt.setPercentTermsToMatch(DOMUtils.getAttribute(e,"percentTermsToMatch",defaultPercentTermsToMatch)/100); mlt.setStopWords(stopWordsSet); mlt.setBoost(DOMUtils.getAttribute(e,"boost",1.0f)); return mlt;