solr - Relevancy score based on term order and text index -


मेरे पास ऐसे दस्तावेज हैं:

  (1) 3825051 3835055 ए 14 051 (2 ) 3833013 3834034 ए 2 013 (3) 4537002 4637021 ए 38 002 (4) 4537002 4537002 एम 38 002 (5) 4537002 4537002 एम 381 002  

मेरी सोलर क्वेरी है: q डेटा + टाइप करें "+ +" a "AND +" 38 "

डेटाटाइप कॉन्फ़िग:

  & lt; fieldType name =" text_wildcard "class =" solr.TextField " & gt; & Lt; विश्लेषक प्रकार = "सूचकांक" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.EnggeramFilterFactory" minGramSize = "1" maxGramSize = "25" पक्ष = "सामने" / & gt; & Lt; / विश्लेषक & gt; & Lt; विश्लेषक प्रकार = "क्वेरी" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; / विश्लेषक & gt; & Lt; / fieldType & gt;  

मुझे पाठ अनुक्रमणिका और "ए" और "38" -> (3), (4), (5), (1 ), (2) अब परिणाम ऊपर की तरह क्रम में है।

क्या कोई भी विचार है?

आपको कुछ प्रयोग की आवश्यकता होगी, लेकिन आप अपनी सामग्री को कई अलग-अलग क्षेत्रों में इंडेक्स कर सकते हैं: आपका वर्तमान फ़ील्ड, एक फ़ील्ड जहां आप एजग्रामफिल्टरफिचरेटर का उपयोग नहीं करते हैं, और संभवतया अधिक फ़ील्ड जहां आप लंबे समय से एजग्रामफिल्टरफैक्टर का उपयोग करते हैं और अब मिनग्राम आकार करें फिर, सभी फ़ील्ड्स के लिए क्वेरी और संभवतः बूस्ट के साथ प्रयोग (उदा। फ़ील्ड 1 नंईजंग्राम्राम ^ 5 फ़ील्ड 2 एगेंग्राम 2 ^ 4 फ़ील्ड 3 एजग्राम 3 ^ 3, आदि)। मुझे लगता है कि आप जो प्रभाव पा रहे हैं, वह प्रभाव होगा - आपके डेटा में सबसे लंबे उपसर्ग के मेल खाते के लिए उच्च रैंक दें।


Comments

Popular posts from this blog

java - Can't add JTree to JPanel of a JInternalFrame -

asp.net mvc - How to attach sql database to a javascript graph -

c# - How to know the number of Threads created and limit the Tasks accordingly -