अपनी साइट खोज को अपग्रेड करें: जनरेटिव एआई की मदद से, काम के जवाब पाएं

जनरेटिव एआई का मतलब है, आर्टिफ़िशियल इंटेलिजेंस की मदद से टेक्स्ट, इमेज, संगीत, ऑडियो, और वीडियो शामिल करें. जनरेटिव एआई, मशीन लर्निंग (एमएल) मॉडल का इस्तेमाल करके, पैटर्न और संबंधों को, इंसानों के बनाए गए कॉन्टेंट के डेटासेट में शामिल करता है.

इस टेक्नोलॉजी ने बेहतरीन काबिलीयत दिखाई है. इसके लिए, हम ये ऐप्लिकेशन इस्तेमाल करते हैं Gemini. आप लोग सोच रहे होंगे कि मैं इसे कैसे लागू करूं मेरे वेब प्रॉडक्ट में जनरेटिव एआई टूल हैं?

एक सामान्य उपयोग का उदाहरण उपयोगकर्ताओं को प्रश्न पूछने के लिए एक बेहतर इंटरफ़ेस उपलब्ध कराना है वेबसाइट के कॉन्टेंट के बारे में ज़्यादा जानें. आप उपयोगकर्ता के खोज नतीजों में काफ़ी सुधार कर सकते हैं, मदद मिलती है.

आप एक ऐसा इंटरफ़ेस बना सकते है जिसमें लोग अपने सवाल लिखें. इसके बाद, लार्ज लैंग्वेज मॉडल (एलएलएम) पर भेजा जाता है. जैसे, Gemini, और फिर अपने उपयोगकर्ताओं को जवाब दिखाएं.

मान लें कि ऐसी सुविधा इस साइट पर मौजूद थी. उपयोगकर्ता जानना चाहता है कि कौनसे एपीआई इसे इंटरऑप 2024 में शामिल किया जाता है और ये यहां दी गई क्वेरी डालते हैं:

What are the features included in Interop 24?

माफ़ करें, आउटपुट के गलत होने की कुछ वजहें हो सकती हैं:

  • उपयोगकर्ता ने एलएलएम को सवाल के बारे में थोड़ी-बहुत जानकारी दी है. इसलिए, एलएलएम ने गलत जवाब या ग़लत जानकारी मिलने की संभावना ज़्यादा होती है.
  • एलएलएम को शायद इंटरऑप 2024 या इसकी सुविधाओं को बनाने से पहले ट्रेनिंग दे दी गई थी नहीं चुना है, इसलिए वह उस जानकारी से अनजान है.

एलएलएम ट्रेनिंग के दौरान, एलएलएम को ज़्यादा नई जानकारी मिल सकती है डेटासेट मूल रूप से पुराने हैं. नए नतीजे बनाए रखना अच्छी बात है और महंगा.

प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करें

प्रॉम्प्ट इंजीनियरिंग एक टेक्नोलॉजी है, जो एलएलएम से सबसे अच्छा आउटपुट पाने के लिए टेक्नोलॉजी का सेट है.

एक तकनीक, प्रॉम्प्ट में ज़्यादा जानकारी देना है. इससे एलएलएम को इस तरह के कॉन्टेंट के आउटपुट की संभावना ज़्यादा होती है.

इंटरऑप उदाहरण के साथ जारी रखते हुए, हमारा पहला कदम है कि पूरी जानकारी का संदर्भ भी शामिल है. इसके बाद, सवाल को इनपुट के तौर पर जवाब देने के लिए, एलएलएम चालू करें. उदाहरण के लिए:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

Gemini से आपको कुछ ऐसा मिल सकता है:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

बिना किसी संदर्भ के निर्देश देने की तुलना में, यह जवाब ज़्यादा बेहतर होता है, क्योंकि दिया गया जवाब, दिए गए संदर्भ पर आधारित होता है.

आरएजी की मदद से पहुंच बढ़ाएं

उदाहरण के लिए, किसी एक लेख से जुड़े सवाल का जवाब देने के बजाय, हम एलएलएम से, web.dev के बारे में ज़्यादा सवालों के जवाब पाने के लिए. इसके लिए, किसी भी लेख को अतिरिक्त जानकारी शामिल है. हालांकि, छोटी साइटों के लिए ऐसा हो सकता है, लेकिन Gemini 1.5 की 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो, बड़े प्रॉम्प्ट चलाने में धीमे और ज़्यादा महंगे होते हैं.

एलएलएम के इनपुट और आउटपुट की लंबाई को टोकन में मापा और चार्ज किया जाता है. ये का इस्तेमाल, टेक्स्ट इनपुट में मिलने वाले वर्णों के सामान्य क्रम को दिखाने का है. कॉन्टेंट बनाने आम तौर पर, टोकन की संख्या शब्दों की संख्या से ज़्यादा होगी. इस तौर पर उदाहरण के लिए, पहले उदाहरण में दिए गए इनपुट में 775 शब्द थे, जिन्हें 1097 से दिखाया गया है टोकन. अलग-अलग एलएलएम, टोकन का हिसाब अलग-अलग तरीके से लगा सकते हैं और ज़्यादातर एपीआई या एंडपॉइंट का इस्तेमाल करें, ताकि टेक्स्ट इनपुट के लिए टोकन की संख्या कैलकुलेट की जा सके.

इसका एक हल है, एलएलएम पर काम के ऐसे लेख उपलब्ध कराना जो तुरंत काम के हों. इस टास्क को दिए गए दो भाग हैं:

  1. एलएलएम से अनुरोध करते समय, संदर्भ के तौर पर सबसे लोकप्रिय लेखों का कॉन्टेंट जोड़ें.
  2. "इसमें कौनसी सुविधाएं शामिल हैं, इससे जुड़े लेखों को खोजें क्या आपको 2024 में सिंक करना है?".

हम चाहते हैं कि Gemini के खोज नतीजों में, इन लेखों के आधार पर कॉन्टेंट दिखे:

इनपुट इस तरह दिखना चाहिए:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

इस कॉन्टेक्स्ट से हमें उम्मीद के मुताबिक नतीजे मिलते हैं.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

जिन लोगों को एआई की तकनीकों के बारे में जानकारी है वे आरएजी का इस्तेमाल करते हैं. यह आम तौर पर इस्तेमाल किया जाने वाला तरीका है ताकि जनरेटिव एआई टूल से सही जवाब मिलने की संभावना बढ़ जाए.

हालाँकि, आरएजी की तकनीक सामान्य तौर पर पूरे टेक्स्ट की खोज के साथ काम कर सकती है. हालांकि, ऐसी कई सुविधाएं भी हैं कमियां हैं.

  • पूरे टेक्स्ट से खोज करने पर, एआई को एग्ज़ैक्ट कीवर्ड मैच ढूंढने में मदद मिलती है. हालाँकि, एलएलएम से आपको का इस्तेमाल किसी उपयोगकर्ता की क्वेरी का मतलब पता करने के लिए किया जाता है. इससे ये समस्याएं हो सकती हैं आउटपुट अधूरे हैं या गलत हैं.
  • शब्दों के एक से ज़्यादा मतलब होने पर या क्वेरी में सवालों के जवाब पाने में समस्या आ सकती है समानार्थी शब्द. उदाहरण के लिए, "बैंक" (वित्तीय संस्थान बनाम रिवरबैंक) भी काम नहीं करते.
  • पूरे टेक्स्ट की खोज के नतीजों में ऐसे नतीजे दिख सकते हैं जिनमें कीवर्ड शामिल होते हैं, लेकिन उपयोगकर्ता के लक्ष्य से मेल न खाते हों.

सिमैंटिक सर्च की मदद से इन अहम पहलुओं पर ध्यान दिया जा सकता है. इससे खोज में ज़्यादा सटीक नतीजे मिलते हैं:

  • खोजने वाले का मकसद: यह इस बात को समझने की कोशिश करता है कि उपयोगकर्ता क्यों खोज रहा है किसी चीज़ के लिए. वे क्या खोजने या हासिल करने की कोशिश कर रहे हैं?
  • प्रासंगिक अर्थ: यह उनके संदर्भ में शब्दों और वाक्यांशों आस-पास का टेक्स्ट और अन्य चीज़ें, जैसे कि उपयोगकर्ता की जगह या खोज इतिहास.
  • कॉन्सेप्ट के बीच संबंध: सिमैंटिक सर्च में नॉलेज ग्राफ़ (बड़े और छोटे अक्षरों में अंतर) का इस्तेमाल होता है और प्राकृतिक भाषा प्रोसेसिंग को समझने के लिए, शब्द और आइडिया आपस में कैसे जुड़े हैं.

इस वजह से, सिमैंटिक खोज के साथ टूल बनाने पर, खोज आउटपुट कीवर्ड के बजाय, क्वेरी के मकसद को पूरा करने के लिए किया जाता है. इसका मतलब है कि कोई टूल ये काम कर सकता है: सटीक कीवर्ड न होने पर भी, काम के दस्तावेज़ तय कर सकते हैं. यह काम कर सकता है साथ ही, ऐसे नतीजों से बचें जिनमें शब्द मौजूद है, लेकिन उसका मतलब अलग है.

फ़िलहाल, आपके पास दो ऐसे खोज टूल लागू करने का विकल्प है जो सिमैंटिक सर्च की सुविधा देते हैं: Vertex AI Search और Algolia AI Search.

पब्लिश किए गए कॉन्टेंट से जवाब बनाना

आपने जवाब देने के लिए एलएलएम चालू करने के लिए, प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करना सीख लिया है ऐसा कॉन्टेंट हो सकता है जिसे प्रॉम्प्ट में संदर्भ जोड़कर कभी नहीं देखा जाता. और आपने अलग-अलग लेखों से पूरे समूह में इस तकनीक को मापने का तरीका सीखा का इस्तेमाल कर रहे हैं रिकवरीवल-ऑगमेंटेड जनरेशन (आरएजी) तकनीक. आपने जाना कि सिमैंटिक खोज से उपयोगकर्ता के लिए नतीजों को और बेहतर कैसे बनाया जा सकता है को बेहतर बनाने में मदद मिलती है.

यह एक जानी-पहचानी समस्या है जिसकी वजह से जनरेटिव एआई, "गलत जानकारी" दे सकता है जिसकी वजह से कभी-कभी गैर-भरोसेमंद या सबसे खराब रूप से, कारोबार. इन तकनीकों से, उपयोगकर्ता और डेवलपर, दोनों और शायद, इन ऐप्लिकेशन से मिलने वाले आउटपुट में भरोसा कायम करता है.