खोज की सुविधा कैसे काम करती है

सर्च इंजन क्या करता है?

सर्च इंजन, लाइब्रेरियन का डिजिटल वर्शन होते हैं. किसी क्वेरी के बारे में सही जानकारी दिखाने के लिए, वे इंप्लिसिट इंडेक्स का इस्तेमाल करते हैं. खोज की बुनियादी बातों को समझने से, आपका कॉन्टेंट उपयोगकर्ताओं को खोजने लायक बनाने में मदद मिलती है.

क्रॉलर वेब को कैसे ब्राउज़ करते हैं

क्रॉल करना, लाइब्रेरी में मौजूद सभी किताबों को पढ़ने जैसा है. सर्च इंजन कोई भी खोज नतीजे खोज सकें, इससे पहले उन्हें वेब पर ज़्यादा से ज़्यादा जानकारी इकट्ठा करने की ज़रूरत होती है. ऐसा करने के लिए, सर्च इंजन एक क्रॉलर का इस्तेमाल करते हैं. यह एक ऐसा प्रोग्राम है जो एक साइट से दूसरी साइट पर जाता है और ब्राउज़र की तरह काम करता है.

अगर कोई किताब या दस्तावेज़ मौजूद नहीं है या उसमें कोई खराबी है, तो क्रॉलर उसे नहीं पढ़ सकता. क्रॉलर, दस्तावेज़ की स्थिति तय करने के लिए, हर यूआरएल को फ़ेच करने की कोशिश करते हैं. अगर दस्तावेज़ में गड़बड़ी का स्टेटस कोड दिखता है, तो क्रॉलर इसके किसी भी कॉन्टेंट का इस्तेमाल नहीं कर सकते. वे बाद में यूआरएल को क्रॉल करने की कोशिश कर सकते हैं. इससे यह पक्का होता है कि सिर्फ़ वे दस्तावेज़ इंडेक्स में शामिल होंगे जिन्हें कोई भी ऐक्सेस कर सकता है.

अगर क्रॉलर को किसी रीडायरेक्शन स्टेटस कोड (जैसे कि 301 या 302) का पता चलता है, तो वे रीडायरेक्ट करने के बाद नए यूआरएल पर जाते हैं और वहां से जाते हैं. सही रिस्पॉन्स मिलने के बाद, जब लोगों को कोई ऐसा दस्तावेज़ मिलता है जिसे लोग ऐक्सेस कर सकते हैं, तब वे जांच करते हैं कि इसे क्रॉल करने की अनुमति है या नहीं. इसके बाद, वे कॉन्टेंट को डाउनलोड करते हैं.

इस जांच में एचटीएमएल और एचटीएमएल में बताया गया पूरा कॉन्टेंट, जैसे कि इमेज, वीडियो या JavaScript शामिल है. क्रॉलर, एचटीएमएल दस्तावेज़ों से भी लिंक निकाल सकते हैं, ताकि क्रॉलर लिंक किए गए यूआरएल पर भी जा सकें. नीचे दिए गए लिंक का इस्तेमाल करके, क्रॉलर वेब पर नए पेज खोजते हैं.

क्रॉलर सक्रिय रूप से लिंक या बटन पर क्लिक नहीं करते, बल्कि उन्हें बाद में क्रॉल करने के लिए यूआरएल एक सूची में भेजते हैं. नया यूआरएल ऐक्सेस करते समय, कोई कुकी, सर्विस वर्कर या लोकल स्टोरेज (जैसे कि IndexedDB) उपलब्ध नहीं होता.

इंडेक्स बनाना

किसी दस्तावेज़ को वापस पाने के बाद, क्रॉलर उस कॉन्टेंट को सर्च इंजन को दे देता है, ताकि उसे इंडेक्स में जोड़ा जा सके. सर्च इंजन अब कॉन्टेंट को रेंडर करता है और उसका विश्लेषण करता है, ताकि वह कॉन्टेंट को समझ सके. रेंडर करने का मतलब है कि पेज को ब्राउज़र की तरह ही दिखाया जाएगा (कुछ सीमाओं के साथ).

सर्च इंजन, कीवर्ड, टाइटल, लिंक, हेडिंग, टेक्स्ट, और कई दूसरी चीज़ों की जांच करते हैं. इन्हें सिग्नल कहा जाता है, जो पेज के कॉन्टेंट और कॉन्टेक्स्ट की जानकारी देते हैं. सिग्नल की मदद से सर्च इंजन, किसी भी क्वेरी का जवाब देने के लिए सबसे बेहतर पेज चुन पाते हैं.

सर्च इंजन को अलग-अलग यूआरएल पर एक जैसा कॉन्टेंट मिल सकता है. उदाहरण के लिए, "Apple पाई" की रेसिपी /recipes/apple-pie और /recipes/1234 से कम में हो सकती है. रेसिपी को दो बार इंडेक्स होने और दिखाने से बचने के लिए, सर्च इंजन यह तय करते हैं कि मुख्य यूआरएल क्या होना चाहिए. साथ ही, वे एक ही कॉन्टेंट दिखाने वाले वैकल्पिक यूआरएल को खारिज कर देते हैं.

सबसे ज़्यादा काम के नतीजे दिखाना

सर्च इंजन, इंडेक्स में क्वेरी का मिलान सिर्फ़ कीवर्ड से करने के अलावा भी बहुत कुछ करते हैं. सही नतीजे दिखाने के लिए, वे संदर्भ, वैकल्पिक शब्दों, उपयोगकर्ता की जगह की जानकारी वगैरह का इस्तेमाल कर सकते हैं. उदाहरण के लिए, "सिलिकॉन वैली" भौगोलिक क्षेत्र या टीवी शो का संदर्भ हो सकता है. हालांकि, अगर क्वेरी "silicon Valley Cast" है, तो इस क्षेत्र के नतीजे बहुत मददगार नहीं हैं.

कुछ क्वेरी सीधे पता न चलने वाली हो सकती हैं, जैसे कि "पल्प फ़िक्शन का गाना". सर्च इंजन को इसका मतलब समझना चाहिए और फ़िल्म में इस्तेमाल किए गए संगीत के नतीजे दिखाने चाहिए. जब कोई उपयोगकर्ता कुछ खोजता है, तो सर्च इंजन सबसे काम के नतीजे तय करते हैं और फिर उन्हें उपयोगकर्ता को दिखाते हैं. क्वेरी के आधार पर पेज की रैंकिंग या उन्हें क्रम से लगाया जाता है. बेहतर जानकारी उपलब्ध होने पर, ऑर्डर का क्रम समय के साथ बदल सकता है.

अगले चरण: सर्च इंजन के लिए ऑप्टिमाइज़ करने का तरीका

अब जब आपको सर्च इंजन के काम करने के तरीके की बुनियादी बातें समझ आ गई हैं, तो आपको सर्च इंजन के लिए ऑप्टिमाइज़ करने का फ़ायदा दिख सकता है. इसे एसईओ या 'सर्च इंजन ऑप्टिमाइज़ेशन' कहते हैं. यह पक्का करने से कि सर्च इंजन आपका कॉन्टेंट ढूंढ सकें और उसे अपने-आप समझ सकें, इससे आपकी साइट पर सही खोज नतीजे दिखाने में मदद मिलती है. इससे आपकी साइट पर, दिलचस्पी रखने वाले ज़्यादा लोग आ सकते हैं. लाइटहाउस की मदद से अपनी साइट का ऑडिट करें और एसईओ के नतीजे देखें. इससे आपको यह पता चलेगा कि सर्च इंजन, उपयोगकर्ताओं को आपके कॉन्टेंट के बारे में कितनी अच्छी तरह से जानकारी दे सकते हैं.