इंटरनेट, ब्लॉग
कैसे Google इंडेक्स से एक साइट या इसके टुकड़े को दूर करने के
अनुक्रमण अवधारणा गूगल द्वारा अपनाई के अनुसार,, पूर्णता के लिए जिम्मेदार जानकारी और परिणाम जारी करने में खोज क्वेरी के लिए अपनी सहमति के लिए निष्पक्षता। सूचकांक गैरकानूनी सामग्री, या स्पैम के लिए संसाधन के साथ वेबसाइट गिर जाता है, तो इस साइट के पन्नों आम डेटाबेस खोज इंजन में चिह्नित नहीं किया जाएगा। हमारे लिए यह जानना महत्वपूर्ण है कि एक साइट को निकालने का तरीका खोज सर्वर के परिणामों के जारी करने से।
शून्य अनुक्रमण गूगल के प्रकार
एक बार खोज रोबोट - नए संसाधनों के बारे में जानकारी इकट्ठा करने के लिए एक कार्यक्रम - पेज से साइट पृष्ठ को स्कैन करेगा, तो, पार्सिंग के लिए Google नीति आवश्यकताओं के तहत, यह अनुक्रमित किया जाएगा जब। लेकिन हम भी बताएंगे कि कैसे एक robots.txt के माध्यम से खोज इंजन के लिए आपकी साइट या टुकड़े को दूर करने के - सूचकांक और एक ही समय स्टॉप पर खोज करते हैं।
एक पूरे के रूप संसाधन के जारी करने से निकालने के लिए, सर्वर जिस पर साइट स्थित है रूट फ़ोल्डर में, एक निश्चित पाठ क्षेत्र बनाता है - robots.txt कहा। इस क्षेत्र के निर्देश पढ़ें के अनुसार खोज इंजन के साथ इलाज किया और कार्य कर रहा है।
ध्यान रखें कि गूगल सर्च इंजन अनुक्रमित पेज, एक उपयोगकर्ता पहुँच गया है, भले ही प्रतिबंध लगा दिया देखने के लिए। ब्राउज़र 401 या 403 के साथ प्रतिक्रिया जब "प्रवेश अमान्य है", यह केवल आगंतुकों के लिए बल्कि प्रोग्राम हैं जो इस के लिए इकट्ठा की तुलना में लागू होता है, खोज इंजन।
यह समझने के लिए दूर करने के लिए कैसे खोज इंजन अनुक्रमण से साइट, एक पाठ सूचक निम्नलिखित लाइनों दर्ज करना होगा:
उपयोगकर्ता-एजेंट: Googlebot
अस्वीकार करें: /
इस क्रॉलर के लिए सूचकांक करने के लिए साइट की सभी सामग्री का निषेध इंगित करता है। यहाँ एक साइट को निकालने का तरीका गूगल, ताकि बाद सूची में संसाधन कैश नहीं है पता चला की।
अलग प्रोटोकॉल के लिए स्कैनिंग के embodiments
आप हाइपरटेक्स्ट के लिए व्यक्तिगत संचार मानक, जिसके लिए आप गूगल का अनुक्रमण, उदाहरण के लिए खास नियम लागू करना चाहते हैं सूचीबद्ध करने के लिए, अलग से की जरूरत है प्रोटोकॉल HTTP / HTTPS, यह भी निम्नलिखित तरीके से (उदाहरण) में robots.txt में रजिस्टर करने के लिए आवश्यक है।
(Http://yourserver.com/robots.txt) - आपकी साइट के लिए एक डोमेन नाम (किसी भी)
उपयोगकर्ता एजेंट: * - किसी भी खोज इंजन
अनुमति दें: / - पूर्ण सूचीकरण की अनुमति देते हैं
मुद्दे से पूरी तरह से https प्रोटोकॉल के लिए एक साइट निकालने का तरीका
(Https://yourserver.com/robots.txt):
उपयोगकर्ता एजेंट: *
अनुमति न दें: अनुक्रमण पर / पूर्ण प्रतिबंध
गूगल SERPs से शीघ्र हटाने URL- संसाधन पतों
आप फिर से सूचीकरण के लिए प्रतीक्षा नहीं करना चाहते हैं और आप जिस साइट की तरह को छिपाने के लिए चाहते हैं, मैं संभव के रूप में जल्द ही सेवा http://services.google.com/urlconsole/controller उपयोग करने के लिए सलाह देते हैं। पूर्व robots.txt साइट सर्वर की रूट निर्देशिका में रखा जाना है। यह उचित निर्देश निर्धारित किया जाना चाहिए।
किसी कारण से सूचक रूट निर्देशिका में संपादित नहीं किया जा सकता है, तो लक्ष्य है जिसके लिए आप खोज इंजन से छुपाना चाहते हैं के साथ फ़ोल्डर में पर्याप्त यह पैदा करते हैं। एक बार जब आप सेवा करने के लिए ऐसा करते हैं और उल्लेख स्वचालित रूप से हाइपरटेक्स्ट पतों को हटाने, गूगल फ़ोल्डरों कि robots.txt में एक दोष से बताया स्कैन नहीं होंगे।
इस अदृश्य होने की अवधि 3 महीने के लिए निर्धारित है। इस अवधि के बाद, निर्देशिका मुद्दे से वापस ले लिया, फिर गूगल सर्वर से कार्रवाई की जाएगी।
एच ow आंशिक रूप से स्कैन करने के लिए किसी साइट को निकालने के लिए
जब एक खोज बॉट robots.txt की सामग्री पढ़ रही है, कि कुछ निर्णय अपनी सामग्री के आधार पर किया जाता है। मान लीजिए कि आप Anatom कहा जाता है पूरी निर्देशिका दिखाने से रोकना चाहते हैं। यह इस तरह के नियमों लिख करने के लिए पर्याप्त है:
उपयोगकर्ता-एजेंट: Googlebot
अस्वीकार करें: / Anatom
या, उदाहरण के लिए, आप नहीं सूचकांक सभी छवि प्रकार .gif करना चाहते हैं। ऐसा करने के लिए, निम्न सूची में जोड़ें:
उपयोगकर्ता-एजेंट: Googlebot
अनुमति न दें: /*.gif$
यहाँ एक और उदाहरण है। चलो उन्हें, गतिशील पृष्ठों के बारे में जानकारी को पार्स से हटा दिया, जबकि सूचकांक प्रविष्टि प्रकार को जोड़ने:
उपयोगकर्ता-एजेंट: Googlebot
अनुमति न दें: / *?
यही कारण है कि के बारे में है, और खोज इंजन के लिए नियमों को बाहर मंत्र। एक और बात यह है कि यह बहुत अधिक सिर्फ इस मेटा टैग का उपयोग करने के लिए सुविधाजनक है। और वेबमास्टर्स अक्सर बस इस तरह के एक मानक खोज इंजन के संचालन को विनियमित करने का उपयोग करें। लेकिन हम भविष्य लेख में इस पर चर्चा करेंगे।
Similar articles
Trending Now