इंटरनेटब्लॉग

कैसे Google इंडेक्स से एक साइट या इसके टुकड़े को दूर करने के

अनुक्रमण अवधारणा गूगल द्वारा अपनाई के अनुसार,, पूर्णता के लिए जिम्मेदार जानकारी और परिणाम जारी करने में खोज क्वेरी के लिए अपनी सहमति के लिए निष्पक्षता। सूचकांक गैरकानूनी सामग्री, या स्पैम के लिए संसाधन के साथ वेबसाइट गिर जाता है, तो इस साइट के पन्नों आम डेटाबेस खोज इंजन में चिह्नित नहीं किया जाएगा। हमारे लिए यह जानना महत्वपूर्ण है कि एक साइट को निकालने का तरीका खोज सर्वर के परिणामों के जारी करने से।

शून्य अनुक्रमण गूगल के प्रकार

एक बार खोज रोबोट - नए संसाधनों के बारे में जानकारी इकट्ठा करने के लिए एक कार्यक्रम - पेज से साइट पृष्ठ को स्कैन करेगा, तो, पार्सिंग के लिए Google नीति आवश्यकताओं के तहत, यह अनुक्रमित किया जाएगा जब। लेकिन हम भी बताएंगे कि कैसे एक robots.txt के माध्यम से खोज इंजन के लिए आपकी साइट या टुकड़े को दूर करने के - सूचकांक और एक ही समय स्टॉप पर खोज करते हैं।

एक पूरे के रूप संसाधन के जारी करने से निकालने के लिए, सर्वर जिस पर साइट स्थित है रूट फ़ोल्डर में, एक निश्चित पाठ क्षेत्र बनाता है - robots.txt कहा। इस क्षेत्र के निर्देश पढ़ें के अनुसार खोज इंजन के साथ इलाज किया और कार्य कर रहा है।

ध्यान रखें कि गूगल सर्च इंजन अनुक्रमित पेज, एक उपयोगकर्ता पहुँच गया है, भले ही प्रतिबंध लगा दिया देखने के लिए। ब्राउज़र 401 या 403 के साथ प्रतिक्रिया जब "प्रवेश अमान्य है", यह केवल आगंतुकों के लिए बल्कि प्रोग्राम हैं जो इस के लिए इकट्ठा की तुलना में लागू होता है, खोज इंजन।

यह समझने के लिए दूर करने के लिए कैसे खोज इंजन अनुक्रमण से साइट, एक पाठ सूचक निम्नलिखित लाइनों दर्ज करना होगा:

उपयोगकर्ता-एजेंट: Googlebot

अस्वीकार करें: /

इस क्रॉलर के लिए सूचकांक करने के लिए साइट की सभी सामग्री का निषेध इंगित करता है। यहाँ एक साइट को निकालने का तरीका गूगल, ताकि बाद सूची में संसाधन कैश नहीं है पता चला की।

अलग प्रोटोकॉल के लिए स्कैनिंग के embodiments

आप हाइपरटेक्स्ट के लिए व्यक्तिगत संचार मानक, जिसके लिए आप गूगल का अनुक्रमण, उदाहरण के लिए खास नियम लागू करना चाहते हैं सूचीबद्ध करने के लिए, अलग से की जरूरत है प्रोटोकॉल HTTP / HTTPS, यह भी निम्नलिखित तरीके से (उदाहरण) में robots.txt में रजिस्टर करने के लिए आवश्यक है।

(Http://yourserver.com/robots.txt) - आपकी साइट के लिए एक डोमेन नाम (किसी भी)

उपयोगकर्ता एजेंट: * - किसी भी खोज इंजन

अनुमति दें: / - पूर्ण सूचीकरण की अनुमति देते हैं

मुद्दे से पूरी तरह से https प्रोटोकॉल के लिए एक साइट निकालने का तरीका

(Https://yourserver.com/robots.txt):

उपयोगकर्ता एजेंट: *

अनुमति न दें: अनुक्रमण पर / पूर्ण प्रतिबंध

गूगल SERPs से शीघ्र हटाने URL- संसाधन पतों

आप फिर से सूचीकरण के लिए प्रतीक्षा नहीं करना चाहते हैं और आप जिस साइट की तरह को छिपाने के लिए चाहते हैं, मैं संभव के रूप में जल्द ही सेवा http://services.google.com/urlconsole/controller उपयोग करने के लिए सलाह देते हैं। पूर्व robots.txt साइट सर्वर की रूट निर्देशिका में रखा जाना है। यह उचित निर्देश निर्धारित किया जाना चाहिए।

किसी कारण से सूचक रूट निर्देशिका में संपादित नहीं किया जा सकता है, तो लक्ष्य है जिसके लिए आप खोज इंजन से छुपाना चाहते हैं के साथ फ़ोल्डर में पर्याप्त यह पैदा करते हैं। एक बार जब आप सेवा करने के लिए ऐसा करते हैं और उल्लेख स्वचालित रूप से हाइपरटेक्स्ट पतों को हटाने, गूगल फ़ोल्डरों कि robots.txt में एक दोष से बताया स्कैन नहीं होंगे।

इस अदृश्य होने की अवधि 3 महीने के लिए निर्धारित है। इस अवधि के बाद, निर्देशिका मुद्दे से वापस ले लिया, फिर गूगल सर्वर से कार्रवाई की जाएगी।

एच ow आंशिक रूप से स्कैन करने के लिए किसी साइट को निकालने के लिए

जब एक खोज बॉट robots.txt की सामग्री पढ़ रही है, कि कुछ निर्णय अपनी सामग्री के आधार पर किया जाता है। मान लीजिए कि आप Anatom कहा जाता है पूरी निर्देशिका दिखाने से रोकना चाहते हैं। यह इस तरह के नियमों लिख करने के लिए पर्याप्त है:

उपयोगकर्ता-एजेंट: Googlebot

अस्वीकार करें: / Anatom

या, उदाहरण के लिए, आप नहीं सूचकांक सभी छवि प्रकार .gif करना चाहते हैं। ऐसा करने के लिए, निम्न सूची में जोड़ें:

उपयोगकर्ता-एजेंट: Googlebot

अनुमति न दें: /*.gif$

यहाँ एक और उदाहरण है। चलो उन्हें, गतिशील पृष्ठों के बारे में जानकारी को पार्स से हटा दिया, जबकि सूचकांक प्रविष्टि प्रकार को जोड़ने:

उपयोगकर्ता-एजेंट: Googlebot

अनुमति न दें: / *?

यही कारण है कि के बारे में है, और खोज इंजन के लिए नियमों को बाहर मंत्र। एक और बात यह है कि यह बहुत अधिक सिर्फ इस मेटा टैग का उपयोग करने के लिए सुविधाजनक है। और वेबमास्टर्स अक्सर बस इस तरह के एक मानक खोज इंजन के संचालन को विनियमित करने का उपयोग करें। लेकिन हम भविष्य लेख में इस पर चर्चा करेंगे।

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hi.atomiyme.com. Theme powered by WordPress.