solr - Relevancy score based on term order and text index -
मेरे पास ऐसे दस्तावेज हैं:
(1) 3825051 3835055 ए 14 051 (2 ) 3833013 3834034 ए 2 013 (3) 4537002 4637021 ए 38 002 (4) 4537002 4537002 एम 38 002 (5) 4537002 4537002 एम 381 002
मेरी सोलर क्वेरी है: q डेटा + टाइप करें "+ +" a "AND +" 38 "
डेटाटाइप कॉन्फ़िग:
& lt; fieldType name =" text_wildcard "class =" solr.TextField " & gt; & Lt; विश्लेषक प्रकार = "सूचकांक" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.EnggeramFilterFactory" minGramSize = "1" maxGramSize = "25" पक्ष = "सामने" / & gt; & Lt; / विश्लेषक & gt; & Lt; विश्लेषक प्रकार = "क्वेरी" & gt; & Lt; टोकनेइज़र वर्ग = "solr.WhitespaceTokenizerFactory" / & gt; & Lt; फिल्टर वर्ग = "solr.LowerCaseFilterFactory" / & gt; & Lt; / विश्लेषक & gt; & Lt; / fieldType & gt;
मुझे पाठ अनुक्रमणिका और "ए" और "38" -> (3), (4), (5), (1 ), (2) अब परिणाम ऊपर की तरह क्रम में है।
क्या कोई भी विचार है?
आपको कुछ प्रयोग की आवश्यकता होगी, लेकिन आप अपनी सामग्री को कई अलग-अलग क्षेत्रों में इंडेक्स कर सकते हैं: आपका वर्तमान फ़ील्ड, एक फ़ील्ड जहां आप एजग्रामफिल्टरफिचरेटर का उपयोग नहीं करते हैं, और संभवतया अधिक फ़ील्ड जहां आप लंबे समय से एजग्रामफिल्टरफैक्टर का उपयोग करते हैं और अब मिनग्राम आकार करें फिर, सभी फ़ील्ड्स के लिए क्वेरी और संभवतः बूस्ट के साथ प्रयोग (उदा। फ़ील्ड 1 नंईजंग्राम्राम ^ 5 फ़ील्ड 2 एगेंग्राम 2 ^ 4 फ़ील्ड 3 एजग्राम 3 ^ 3, आदि)। मुझे लगता है कि आप जो प्रभाव पा रहे हैं, वह प्रभाव होगा - आपके डेटा में सबसे लंबे उपसर्ग के मेल खाते के लिए उच्च रैंक दें।
Comments
Post a Comment