गठनमाध्यमिक शिक्षा और स्कूलों

निकटतम पड़ोसी विधि: काम के उदाहरण

निकटतम पड़ोसी विधि सबसे आसान मीट्रिक वर्गीकारक जो विभिन्न वस्तुओं की समानता के मूल्यांकन पर आधारित है।

विश्लेषण वस्तु वर्ग जो करने के लिए वे प्रशिक्षण नमूना के विषयों से संबंधित के अंतर्गत आता है। हमें यह पता लगाना है जो निकटतम पड़ोसी है करते हैं। जटिल मामला, विभिन्न तकनीकों के उदाहरण समझने की कोशिश करो।

परिकल्पना विधि

निकटतम पड़ोसी विधि सबसे आम वर्गीकरण के लिए इस्तेमाल किया एल्गोरिथ्म के रूप में माना जा सकता है। वस्तु वर्गीकरण के दौर से गुजर जो सबसे करीब वस्तु x_i नमूना सीखने के वर्ग y_i के अंतर्गत आता है,।

तरीकों निकटतम पड़ोसियों की विशिष्टता

निकटतम पड़ोसी विधि वर्गीकरण की सटीकता में सुधार कर सकते हैं k। विश्लेषण वस्तु अपने पड़ोसियों के थोक के रूप में एक ही कक्षा के अंतर्गत आता है, वह है, करीब k यह विश्लेषण किया नमूना x_i की वस्तुओं के लिए। पड़ोसियों की संख्या के दो वर्गों के साथ समस्याओं को सुलझाने में, अस्पष्टता की स्थिति से बचने के लिए अजीब हो सकता है अगर पड़ोसियों के एक ही नंबर विभिन्न वर्गों से संबंधित होगा।

निलंबित पड़ोसियों की तकनीक

PostgreSQL से विश्लेषण विधि tsvector निकटतम पड़ोसियों कक्षाएं कम से कम तीन की संख्या है, और आप एक विषम संख्या का उपयोग नहीं कर सकते हैं जब प्रयोग किया जाता है। लेकिन अस्पष्टता भी इन मामलों में उठता है। फिर, मैं-वें पड़ोसी w_i वजन है, जो पड़ोसी रैंक मैं के साथ कम हो जाती है हो जाता है। यह वस्तु के वर्ग है, जो करीब पड़ोसियों के बीच एक अधिकतम कुल वजन होगा को दर्शाता है।

सघनता की परिकल्पना

उपरोक्त सभी पद्धति के केंद्र में सघनता की परिकल्पना है। यह वस्तुओं की समानता के उपाय और एक ही वर्ग के लिए उनके संबंधित के बीच एक कनेक्शन पता चलता है। इस स्थिति में, विभिन्न प्रकार के बीच की सीमा एक सरल रूप है, और अंतरिक्ष कॉम्पैक्ट मोबाइल क्षेत्र में वस्तुओं की कक्षाएं बना। ऐसे क्षेत्रों के तहत गणितीय विश्लेषण में एक बंद कर दिया घिरे सेट मतलब करने के लिए लिया। इस परिकल्पना शब्द की रोजमर्रा की धारणा से संबंधित नहीं है।

बुनियादी सूत्र

हमें और अधिक निकटतम पड़ोसी की जांच करें। यदि प्रस्तावित प्रशिक्षण नमूना प्रकार "वस्तु-प्रतिक्रिया» एक्स ^ m = \ {(x_1, y_1), \ डॉट्स, (x_m, y_m) \}; यदि वस्तुओं की अधिकता दूरी समारोह \ रो (एक्स, एक्स ') को परिभाषित करने फंक्शन का मान बढ़ाने के द्वारा जो वस्तुओं की पर्याप्त मॉडल समानता के रूप में प्रस्तुत किया जाता है, वस्तुओं के बीच एक्स, एक्स समानता कम हो जाती है'।

किसी भी वस्तु के लिए, यू का निर्माण करेगा एक प्रशिक्षण नमूना यू के लिए दूरी में वृद्धि के साथ वस्तुओं x_i:

\ रो (यू, x_ {1; यू}) \ Leq \ रो (यू, x_ {2; यू}) \ Leq \ cdots \ Leq \ रो (यू, x_ {मीटर; यू})

जहां x_ {मैं; यू} वस्तु सीखने नमूना है, जो आई-वें पड़ोसी स्रोत ऑब्जेक्ट है यू की विशेषता है। इस तरह के अंकन और उपयोग i-वें पड़ोसी के लिए उत्तर करने के लिए: y_ {मैं; यू}। नतीजतन, हम चाहते हैं कि किसी भी वस्तु यू खुद का नमूना renumbering भड़काती हैं।

पड़ोसियों की संख्या कश्मीर का निर्धारण

निकटतम पड़ोसी विधि जब k = 1 न केवल वस्तुओं उत्सर्जन पर, लेकिन यह भी अन्य वर्गों है कि निकट रहे हैं के लिए एक गलत वर्गीकरण देने में सक्षम है।

हम = मी k लेते हैं, कलन विधि के रूप में स्थिर हो जाएगा और एक निरंतर मूल्य में पतित होगा। क्यों विश्वसनीयता चरम सूचकांक k से बचने के लिए महत्वपूर्ण है कि है।

अभ्यास में, के रूप में इष्टतम सूचकांक k इस्तेमाल किया कसौटी नियंत्रण फिसलने।

स्क्रीनिंग उत्सर्जन

अध्ययन की वस्तुओं को काफी हद तक असमान हैं, लेकिन उनके बीच वहाँ जो एक वर्ग की विशेषताओं और मानकों रूप में भेजा जाता है जो कर रहे हैं। इस वर्ग से संबंधित के अपने उच्च संभावना के आदर्श मॉडल के अधीन की निकटता पर।

कैसे rezultativen निकटतम पड़ोसियों की विधि? एक उदाहरण वस्तुओं के परिधीय और गैर-जानकारी श्रेणियों के आधार पर देखा जा सकता है। यह इस वर्ग की वस्तु अन्य प्रतिनिधियों के घने वातावरण माना जाता है। जब आप उन्हें गुणवत्ता पर असर पड़ नहीं होंगे नमूने के वर्गीकरण से हटा दें।

नमूने मई शोर फटने है कि एक वर्ग की "जमीन पर" कर रहे हैं की एक निश्चित संख्या में शामिल हों। वर्गीकरण की गुणवत्ता पर काफी हद तक सकारात्मक प्रभाव निकाला जा रहा है।

नमूना uninformative और खत्म करने शोर वस्तुओं से लिया है, तो आप एक ही समय में कुछ सकारात्मक परिणाम पर भरोसा कर सकते हैं।

पहले के प्रक्षेप विधि निकटतम पड़ोसी वर्गीकरण गुणवत्ता में सुधार करने, संग्रहीत डेटा की मात्रा को कम, वर्गीकरण, जो अगले मानकों की पसंद पर खर्च किया जाता है के समय को कम कर सकते हैं।

अल्ट्रा बड़े नमूनों के उपयोग

निकटतम पड़ोसी विधि शिक्षा वस्तुओं के वास्तविक भंडारण पर आधारित है। बहुत बड़े पैमाने पर एक तकनीकी समस्या का उपयोग कर नमूने बनाने के लिए। उद्देश्य सिर्फ जानकारी का एक महत्वपूर्ण राशि बचा है नहीं करने के लिए, लेकिन यह भी समय की न्यूनतम राशि में किसी भी वस्तु यू करीबी पड़ोसियों के बीच k को खोजने के लिए समय है।

इस कार्य के साथ सामना करने के लिए, दो तरीकों का इस्तेमाल किया जाता है:

  • एक मुक्ति गैर डेटा वस्तुओं के माध्यम से पतला नमूना;
  • प्रभावी उपयोग विशेष डेटा संरचना और निकटतम पड़ोसियों के त्वरित खोज के लिए कोड।

चयन के तरीकों के नियम

ऊपर वर्गीकरण माना जाता था। निकटतम पड़ोसी विधि व्यावहारिक समस्याओं, जो पहले से दूरी समारोह \ रो जाना जाता है को हल करने में प्रयोग किया जाता है (एक्स, एक्स ')। का वर्णन वस्तुओं में संख्यात्मक वैक्टर एक इयूक्लिडियन मीट्रिक का उपयोग करें। यह चुनाव कोई विशेष औचित्य है, लेकिन सभी लक्षण की माप में शामिल है "एक ही पैमाने में।" अगर इस पहलू को ध्यान में नहीं लिया जाता है, तो मीट्रिक सुविधा उच्चतम संख्यात्मक मान होने प्रबल होना होगा।

अगर वहाँ सुविधाओं की एक पर्याप्त राशि, विशिष्ट लक्षणों पर विचलन की राशि के रूप दूरी की गणना है दिखाई गंभीर समस्या आयाम।

उच्च आयामी एक-दूसरे होगा सभी वस्तुओं से दूर अंतरिक्ष में। अंत में, किसी भी नमूने वस्तु के बगल में कश्मीर पड़ोसियों अध्ययन किया जा रहा हो जाएगा। इस समस्या को खत्म करने के लिए जानकारीपूर्ण सुविधाओं की एक छोटी संख्या का चयन किया। अनुमानों की गणना के लिए एल्गोरिदम संकेत के विभिन्न सेट के आधार पर निर्माण, और प्रत्येक व्यक्ति के लिए उनकी निकटता समारोह का निर्माण।

निष्कर्ष

गणितीय गणना अक्सर तकनीक है कि अपने स्वयं के विशिष्ट विशेषताओं के फायदे और नुकसान की एक किस्म के इस्तेमाल को शामिल। देखा गया निकटतम पड़ोसी विधि गणितीय वस्तुओं की विशेषताओं के कारण काफी गंभीर समस्या को हल कर सकते हैं। प्रयोगात्मक अवधारणा, विश्लेषण किया पद्धति पर आधारित सक्रिय रूप से कृत्रिम बुद्धि में इस्तेमाल किया जा रहा है।

विशेषज्ञ प्रणालियों में यह सिर्फ वस्तुओं वर्गीकृत करने के लिए ही नहीं, बल्कि उपयोगकर्ता सवाल में वर्गीकरण की एक विवरण दिखाने के लिए आवश्यक है। इस विधि में, इस घटना के एक विवरण एक विशेष वर्ग की वस्तु के रूप में अच्छी तरह से इस्तेमाल किया नमूना से संबंधित उसका स्थान के संबंध में व्यक्त कर रहे हैं। कानूनी उद्योग विशेषज्ञों, भूवैज्ञानिकों, चिकित्सकों, इस "मिसाल" तर्क सक्रिय रूप से अपने अनुसंधान के क्षेत्र में इसका इस्तेमाल करते हैं।

आदेश में विश्लेषण करने की विधि थी सबसे विश्वसनीय, कुशल, वांछित परिणाम दे रही है, तो आप एक न्यूनतम आंकड़ा कश्मीर ले करते हुए भी विश्लेषण किया वस्तुओं के बीच उत्सर्जन से बचना चाहिए। यही कारण है कि मानकों के उपयोग और चयन विधि है, साथ ही अनुकूलन मैट्रिक्स।

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hi.atomiyme.com. Theme powered by WordPress.