अपनी साइट खोज को अपग्रेड करें: जनरेटिव एआई की मदद से, काम के जवाब पाएं

André Cipriani Bandarra

जनरेटिव एआई का मतलब है, टेक्स्ट, इमेज, संगीत, ऑडियो, और वीडियो जैसे नए कॉन्टेंट बनाने के लिए, आर्टिफ़िशियल इंटेलिजेंस (एआई) का इस्तेमाल करना. जनरेटिव एआई, मशीन लर्निंग (एमएल) मॉडल पर निर्भर करता है. इससे, यह लोगों के बनाए गए कॉन्टेंट के डेटासेट में पैटर्न और रिलेशनशिप को समझ पाता है.

Gemini जैसे ऐप्लिकेशन की मदद से, इस टेक्नोलॉजी की बेहतरीन क्षमताओं का पता चला है. आपको यह जानना हो सकता है कि अपने वेब प्रॉडक्ट में, जनरेटिव एआई टूल कैसे लागू किए जा सकते हैं?

इसका एक सामान्य इस्तेमाल, उपयोगकर्ताओं को किसी वेबसाइट के कॉन्टेंट के बारे में सवाल पूछने के लिए बेहतर इंटरफ़ेस उपलब्ध कराना है. मशीन लर्निंग की मदद से, उपयोगकर्ताओं को खोज के बेहतर नतीजे दिखाए जा सकते हैं.

साइट के हिसाब से बेहतर खोज की सुविधा बनाना

आपके पास ऐसा इंटरफ़ेस बनाने का विकल्प है जहां उपयोगकर्ता अपना सवाल लिखते हैं. इसके बाद, यह सवाल Gemini जैसे लार्ज लैंग्वेज मॉडल (एलएलएम) को भेजा जाता है. इसके बाद, उपयोगकर्ताओं को जवाब दिखाए जाते हैं.

मान लें कि इस साइट पर ऐसी सुविधा मौजूद थी. किसी उपयोगकर्ता को यह जानना है कि Interop 2024 में कौनसे एपीआई शामिल हैं. इसके लिए, वह यह क्वेरी डालता है:

What are the features included in Interop 24?

माफ़ करें, कुछ वजहों से आउटपुट गलत हो सकता है:

उपयोगकर्ता ने एलएलएम को सवाल के बारे में ज़्यादा जानकारी नहीं दी है. इसलिए, एलएलएम के गलत जवाब देने या गलत जानकारी देने की संभावना ज़्यादा होती है.
ऐसा हो सकता है कि एलएलएम को Interop 2024 के बनने या उसकी सुविधाओं के तय होने से पहले ट्रेन किया गया हो. इसलिए, यह उस जानकारी के बारे में नहीं जानता.

एलएलएम को ज़्यादा अप-टू-डेट जानकारी मिल सकती है. हालांकि, एलएलएम के ट्रेनिंग डेटासेट में मौजूद जानकारी पुरानी होती है. नए नतीजे पाने के लिए, काफ़ी समय और पैसे लग सकते हैं.

प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करना

प्रॉम्प्ट इंजीनियरिंग, एलएलएम से सबसे अच्छा आउटपुट पाने के लिए तकनीकों का एक सेट है.

प्रॉम्प्ट में ज़्यादा जानकारी देने की एक तकनीक है. इससे एलएलएम, कॉन्टेक्स्ट से जुड़ा कॉन्टेंट दिखाने की संभावना ज़्यादा बढ़ा देता है.

इंटरऑपरेबिलिटी के उदाहरण को जारी रखते हुए, हमारा पहला चरण लेख का पूरा कॉन्टेंट संदर्भ के तौर पर देना है. इसके बाद, सवाल को LLM के जवाब के तौर पर इनपुट के तौर पर जोड़ें. उदाहरण के लिए:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

आपको Gemini से इस तरह का आउटपुट मिल सकता है:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

यह जवाब, कॉन्टेक्स्ट के बिना दिए गए प्रॉम्प्ट के जवाब से काफ़ी बेहतर हो सकता है, क्योंकि यह जवाब दिए गए कॉन्टेक्स्ट पर आधारित होता है.

आरएजी की मदद से स्केल अप करना

उदाहरण के लिए, हम चाहते हैं कि एलएलएम किसी एक लेख के बारे में सवाल के जवाब देने के बजाय, web.dev के बारे में ज़्यादा सवालों के जवाब दे. इसके लिए, वह किसी भी लेख का इस्तेमाल अतिरिक्त संदर्भ के तौर पर कर सकता है. हालांकि, यह छोटी साइटों के लिए मुमकिन है, लेकिन Gemini 1.5 की कॉन्टेक्स्ट-विंडो 10 लाख टोकन होने पर, बड़े प्रॉम्प्ट धीमे और ज़्यादा महंगे होते हैं.

एलएलएम के इनपुट और आउटपुट की लंबाई को टोकन में मेज़र किया जाता है और उन पर शुल्क लिया जाता है. टोकन, टेक्स्ट इनपुट में पाए जाने वाले वर्णों के सामान्य क्रम को दिखाने का एक तरीका है. आम तौर पर, टोकन की संख्या, शब्दों की संख्या से ज़्यादा होगी. उदाहरण के लिए, पहले उदाहरण में दिए गए इनपुट में 775 शब्द थे, जिन्हें 1,097 टोकन से दिखाया गया था. अलग-अलग एलएलएम, टोकन का हिसाब अलग-अलग तरीके से लगा सकते हैं. ज़्यादातर एलएलएम, टेक्स्ट इनपुट के लिए टोकन की संख्या का हिसाब लगाने के लिए एपीआई या एंडपॉइंट उपलब्ध कराते हैं.

एक तरीका यह है कि एलएलएम प्रॉम्प्ट से जुड़े लेख उपलब्ध कराएं. इस टास्क को दो हिस्सों में बांटकर दिया जाना चाहिए:

एलएलएम को प्रॉम्प्ट करते समय, सबसे लोकप्रिय लेखों का कॉन्टेंट संदर्भ के तौर पर जोड़ें.
"Interop 2024 में कौनसी सुविधाएं शामिल हैं?" से जुड़े लेख खोजें.

हम चाहते हैं कि Gemini के नतीजों में, इन लेखों के आधार पर कॉन्टेंट दिखे:

पहला लेख: web.dev/blog/submit-your-proposals-for-interop-2024
दूसरा लेख: web.dev/blog/interop-2023-wrapup
तीसरा लेख: web.dev/blog/interop-2024

इनपुट इस तरह दिखना चाहिए:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

इस कॉन्टेक्स्ट से हमें उम्मीद के मुताबिक नतीजा मिलता है.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

एआई की तकनीकों के बारे में जानने वाले लोगों के लिए, इस तरीके में आरएजी का इस्तेमाल किया जाता है. यह एक सामान्य तरीका है, जिससे जनरेटिव एआई टूल से असल जवाब पाने की संभावना बढ़ जाती है.

सेमेटिक सर्च की मदद से आउटपुट को बेहतर बनाना

आरएजी तकनीक, पूरे टेक्स्ट की सामान्य खोज के साथ काम कर सकती है. हालांकि, इस तरीके में कुछ कमियां हैं.

पूरे टेक्स्ट में खोजने की सुविधा से, एआई को एग्ज़ैक्ट मैच वाले कीवर्ड ढूंढने में मदद मिलती है. हालांकि, एलएलएम किसी उपयोगकर्ता की क्वेरी के सही मतलब का पता नहीं लगा पाते. इस वजह से, आउटपुट अधूरे या गलत हो सकते हैं.
जब शब्दों के कई मतलब होते हैं या क्वेरी में मिलते-जुलते शब्दों का इस्तेमाल किया जाता है, तो समस्याएं आ सकती हैं. उदाहरण के लिए, "बैंक" (वित्तीय संस्थान बनाम नदी का किनारा) से काम के नतीजे नहीं मिल सकते.
पूरे टेक्स्ट में खोजने की सुविधा से ऐसे नतीजे मिल सकते हैं जिनमें कीवर्ड शामिल होते हैं, लेकिन वे उपयोगकर्ता के मकसद के मुताबिक नहीं होते.

सेमांटिक सर्च एक ऐसी तकनीक है जिससे खोज के नतीजों को ज़्यादा सटीक बनाया जा सकता है. इसके लिए, इन अहम बातों पर ध्यान दिया जाता है:

खोज करने वाले के इंटेंट: इससे यह समझने की कोशिश की जाती है कि कोई उपयोगकर्ता किसी चीज़ को क्यों खोज रहा है. वे क्या खोज रहे हैं या क्या हासिल करना चाहते हैं?
कॉन्टेक्स्ट के हिसाब से शब्दों का मतलब: यह शब्दों और वाक्यांशों का मतलब, आस-पास के टेक्स्ट के साथ-साथ उपयोगकर्ता की जगह या खोज के इतिहास जैसे अन्य फ़ैक्टर के हिसाब से बताता है.
कॉन्सेप्ट के बीच का संबंध: सेमैनटिक सर्च, नॉलेज ग्राफ़ (मिलती-जुलती इकाइयों के बड़े नेटवर्क) और नैचुरल लैंग्वेज प्रोसेसिंग का इस्तेमाल करके यह समझता है कि शब्द और विचार किस तरह से जुड़े हैं.

इसलिए, जब सेमैनटिक सर्च की मदद से टूल बनाए जाते हैं, तो खोज के नतीजे, कीवर्ड के बजाय क्वेरी के पूरे मकसद पर निर्भर करते हैं. इसका मतलब है कि कोई टूल, काम के दस्तावेज़ों का पता लगा सकता है. भले ही, उसमें सटीक कीवर्ड मौजूद न हो. इससे उन नतीजों को भी हटाया जा सकता है जिनमें शब्द मौजूद है, लेकिन उसका मतलब अलग है.

फ़िलहाल, ऐसे दो सर्च टूल लागू किए जा सकते हैं जिनमें सेमैटिक सर्च का इस्तेमाल किया जाता है: Vertex AI Search और Algolia AI Search.

पब्लिश किए गए कॉन्टेंट से जवाब पाना

आपने प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करने का तरीका जाना है. इससे एलएलएम को प्रॉम्प्ट में कॉन्टेक्स्ट जोड़कर, ऐसे कॉन्टेंट से जुड़े जवाब देने में मदद मिलती है जिसे उसने पहले कभी नहीं देखा है. साथ ही, आपने रिट्रिवल-ऑगमेंटेड जनरेशन (आरएजी) तकनीक का इस्तेमाल करके, इस तरीके को अलग-अलग लेखों से कॉन्टेंट के पूरे कॉर्पस तक बढ़ाने का तरीका भी जाना है. आपने जाना कि अपने प्रॉडक्ट में आरएजी को बेहतर तरीके से लागू करके, उपयोगकर्ता की खोज क्वेरी के नतीजों को सेमैटिक सर्च की मदद से कैसे बेहतर बनाया जा सकता है.

यह एक आम समस्या है कि जनरेटिव एआई टूल "गलत जानकारी" दे सकते हैं. इससे, कभी-कभी इन पर भरोसा नहीं किया जा सकता या फिर ये किसी कारोबार के लिए नुकसानदेह साबित हो सकते हैं. इन तकनीकों की मदद से, उपयोगकर्ता और डेवलपर, दोनों ही ऐप्लिकेशन के काम करने के तरीके को बेहतर बना सकते हैं. साथ ही, इन ऐप्लिकेशन के आउटपुट पर भरोसा भी बढ़ाया जा सकता है.