solr - Relevancy score based on term order and text index -


मेरे पास ऐसे दस्तावेज हैं:

  (1) 3825051 3835055 ए 14 051 (2 ) 3833013 3834034 ए 2 013 (3) 4537002 4637021 ए 38 002 (4) 4537002 4537002 एम 38 002 (5) 4537002 4537002 एम 381 002  

मेरी सोलर क्वेरी है: q डेटा + टाइप करें "+ +" a "AND +" 38 "

डेटाटाइप कॉन्फ़िग:

  & lt; fieldType name =" text_wildcard "class =" solr.TextField " & gt; & Lt; विश्लेषक प्रकार = "सूचकांक" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.EnggeramFilterFactory" minGramSize = "1" maxGramSize = "25" पक्ष = "सामने" / & gt; & Lt; / विश्लेषक & gt; & Lt; विश्लेषक प्रकार = "क्वेरी" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; / विश्लेषक & gt; & Lt; / fieldType & gt;  

मुझे पाठ अनुक्रमणिका और "ए" और "38" -> (3), (4), (5), (1 ), (2) अब परिणाम ऊपर की तरह क्रम में है।

क्या कोई भी विचार है?

आपको कुछ प्रयोग की आवश्यकता होगी, लेकिन आप अपनी सामग्री को कई अलग-अलग क्षेत्रों में इंडेक्स कर सकते हैं: आपका वर्तमान फ़ील्ड, एक फ़ील्ड जहां आप एजग्रामफिल्टरफिचरेटर का उपयोग नहीं करते हैं, और संभवतया अधिक फ़ील्ड जहां आप लंबे समय से एजग्रामफिल्टरफैक्टर का उपयोग करते हैं और अब मिनग्राम आकार करें फिर, सभी फ़ील्ड्स के लिए क्वेरी और संभवतः बूस्ट के साथ प्रयोग (उदा। फ़ील्ड 1 नंईजंग्राम्राम ^ 5 फ़ील्ड 2 एगेंग्राम 2 ^ 4 फ़ील्ड 3 एजग्राम 3 ^ 3, आदि)। मुझे लगता है कि आप जो प्रभाव पा रहे हैं, वह प्रभाव होगा - आपके डेटा में सबसे लंबे उपसर्ग के मेल खाते के लिए उच्च रैंक दें।


Comments

Popular posts from this blog

mysql - How to enter php data into a html multiple select box -

java - Can't add JTree to JPanel of a JInternalFrame -

c++ - Cassandra datastax cpp driver - avoiding unnecessary copies -