solr - Relevancy score based on term order and text index -

- February 15, 2011

मेरे पास ऐसे दस्तावेज हैं:

  (1) 3825051 3835055 ए 14 051 (2 ) 3833013 3834034 ए 2 013 (3) 4537002 4637021 ए 38 002 (4) 4537002 4537002 एम 38 002 (5) 4537002 4537002 एम 381 002

मेरी सोलर क्वेरी है: q डेटा + टाइप करें "+ +" a "AND +" 38 "

डेटाटाइप कॉन्फ़िग:

  & lt; fieldType name =" text_wildcard "class =" solr.TextField " & gt; & Lt; विश्लेषक प्रकार = "सूचकांक" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.EnggeramFilterFactory" minGramSize = "1" maxGramSize = "25" पक्ष = "सामने" / & gt; & Lt; / विश्लेषक & gt; & Lt; विश्लेषक प्रकार = "क्वेरी" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; / विश्लेषक & gt; & Lt; / fieldType & gt;

मुझे पाठ अनुक्रमणिका और "ए" और "38" -> (3), (4), (5), (1 ), (2) अब परिणाम ऊपर की तरह क्रम में है।

क्या कोई भी विचार है?

आपको कुछ प्रयोग की आवश्यकता होगी, लेकिन आप अपनी सामग्री को कई अलग-अलग क्षेत्रों में इंडेक्स कर सकते हैं: आपका वर्तमान फ़ील्ड, एक फ़ील्ड जहां आप एजग्रामफिल्टरफिचरेटर का उपयोग नहीं करते हैं, और संभवतया अधिक फ़ील्ड जहां आप लंबे समय से एजग्रामफिल्टरफैक्टर का उपयोग करते हैं और अब मिनग्राम आकार करें फिर, सभी फ़ील्ड्स के लिए क्वेरी और संभवतः बूस्ट के साथ प्रयोग (उदा। फ़ील्ड 1 नंईजंग्राम्राम ^ 5 फ़ील्ड 2 एगेंग्राम 2 ^ 4 फ़ील्ड 3 एजग्राम 3 ^ 3, आदि)। मुझे लगता है कि आप जो प्रभाव पा रहे हैं, वह प्रभाव होगा - आपके डेटा में सबसे लंबे उपसर्ग के मेल खाते के लिए उच्च रैंक दें।

Search This Blog

Quick

solr - Relevancy score based on term order and text index -

Comments

Post a Comment

Popular posts from this blog

java - Can't add JTree to JPanel of a JInternalFrame -

python - Calculate STD manually using Groupby Pandas DataFrame -

java - @PluginTarget(Node.class) not registering as neo4j plugin -