जनरेटिव एआई का मतलब है, टेक्स्ट, इमेज, संगीत, ऑडियो, और वीडियो जैसे नए कॉन्टेंट बनाने के लिए, आर्टिफ़िशियल इंटेलिजेंस (एआई) का इस्तेमाल करना. जनरेटिव एआई, मशीन लर्निंग (एमएल) मॉडल का इस्तेमाल करता है. इससे वह लोगों के बनाए गए कॉन्टेंट के डेटासेट के पैटर्न और संबंधों को समझ पाता है.
Gemini जैसे ऐप्लिकेशन की मदद से, इस टेक्नोलॉजी की बेहतरीन क्षमताओं का पता चला है. आपको यह जानना हो सकता है कि अपने वेब प्रॉडक्ट में जनरेटिव एआई टूल कैसे लागू करें?
इसका एक सामान्य इस्तेमाल, उपयोगकर्ताओं को किसी वेबसाइट के कॉन्टेंट के बारे में सवाल पूछने के लिए बेहतर इंटरफ़ेस उपलब्ध कराना है. मशीन लर्निंग की मदद से, उपयोगकर्ताओं को खोज के बेहतर नतीजे दिखाए जा सकते हैं.
साइट के हिसाब से बेहतर खोज की सुविधा बनाना
आपके पास ऐसा इंटरफ़ेस बनाने का विकल्प है जहां उपयोगकर्ता अपना सवाल लिखते हैं. इसके बाद, उस सवाल को Gemini जैसे लार्ज लैंग्वेज मॉडल (एलएलएम) को भेजा जाता है. इसके बाद, उपयोगकर्ताओं को जवाब दिखाए जाते हैं.
मान लें कि इस साइट पर ऐसी सुविधा मौजूद थी. किसी उपयोगकर्ता को यह जानना है कि Interop 2024 में कौनसे एपीआई शामिल हैं. इसके लिए, वह यह क्वेरी डालता है:
What are the features included in Interop 24?
माफ़ करें, कुछ वजहों से आउटपुट गलत हो सकता है:
- उपयोगकर्ता ने एलएलएम को सवाल के बारे में कम जानकारी दी है. इसलिए, एलएलएम के गलत जवाब देने या गलत जानकारी देने की संभावना ज़्यादा होती है.
- एलएलएम को शायद इंटरऑप 2024 बनाने से पहले ट्रेनिंग दे दी गई है या इसकी सुविधाओं ने तय किया है. इसलिए, इसे इस जानकारी के बारे में जानकारी नहीं है.
ऐसा मुमकिन है कि एलएलएम को ज़्यादा नई जानकारी मिल पाए. हालाँकि, एलएलएम ट्रेनिंग के डेटासेट पहले से पुराने हैं. नए नतीजे पाने में काफ़ी समय और पैसा लग सकता है.
प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करें
प्रॉम्प्ट इंजीनियरिंग, एलएलएम से सबसे अच्छा आउटपुट पाने के लिए इस्तेमाल की जाने वाली तकनीकों का एक सेट है.
प्रॉम्प्ट में ज़्यादा जानकारी देने की एक तकनीक है. इससे एलएलएम, कॉन्टेक्स्ट से जुड़ा कॉन्टेंट दिखाने की संभावना ज़्यादा बढ़ा देता है.
इंटरऑपरेबिलिटी के उदाहरण को जारी रखते हुए, हमारा पहला चरण लेख का पूरा कॉन्टेंट, संदर्भ के तौर पर देना है. इसके बाद, सवाल को एलएलएम के लिए इनपुट के तौर पर जोड़ें. उदाहरण के लिए:
Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)
Input:
What are the features included in Interop 2024?
Gemini से आपको कुछ ऐसा मिल सकता है:
The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL
यह जवाब, कॉन्टेक्स्ट के बिना दिए गए प्रॉम्प्ट के जवाब से काफ़ी बेहतर हो सकता है, क्योंकि यह जवाब दिए गए कॉन्टेक्स्ट पर आधारित होता है.
आरएजी की मदद से कारोबार को बढ़ाना
उदाहरण के लिए, हम चाहते हैं कि किसी एक लेख से जुड़े सवाल का जवाब देने के बजाय, एलएलएम से web.dev के बारे में ज़्यादा से ज़्यादा सवालों के जवाब दें. इसके लिए, एलएलएम किसी भी लेख को अतिरिक्त कॉन्टेक्स्ट के तौर पर इस्तेमाल करें. हालांकि, यह छोटी साइटों के लिए मुमकिन है, लेकिन Gemini 1.5 की कॉन्टेक्स्ट-विंडो में 10 लाख टोकन होने की वजह से, बड़े प्रॉम्प्ट धीमे और ज़्यादा महंगे होते हैं.
एलएलएम के इनपुट और आउटपुट की लंबाई को टोकन में मेज़र किया जाता है और उन पर शुल्क लिया जाता है. टोकन, टेक्स्ट इनपुट में पाए जाने वाले वर्णों के सामान्य क्रम को दिखाने का एक तरीका है. आम तौर पर, टोकन की संख्या, शब्दों की संख्या से ज़्यादा होगी. उदाहरण के लिए, पहले उदाहरण में दिए गए इनपुट में 775 शब्द थे, जिन्हें 1,097 टोकन से दिखाया गया था. अलग-अलग एलएलएम, टोकन का हिसाब अलग-अलग तरीके से लगा सकते हैं. ज़्यादातर एलएलएम, टेक्स्ट इनपुट के लिए टोकन की संख्या का हिसाब लगाने के लिए एपीआई या एंडपॉइंट उपलब्ध कराते हैं.
एक तरीका यह है कि एलएलएम प्रॉम्प्ट से जुड़े लेख उपलब्ध कराएं. इस टास्क को दो हिस्सों में बांटना चाहिए:
- एलएलएम को प्रॉम्प्ट करते समय, सबसे लोकप्रिय लेखों का कॉन्टेंट संदर्भ के तौर पर जोड़ें.
- "Interop 2024 में कौनसी सुविधाएं शामिल हैं?" से जुड़े लेख खोजें.
हम चाहते हैं कि Gemini के नतीजों में, इन लेखों के आधार पर कॉन्टेंट दिखे:
- लेख 1: web.dev/blog/submit-your-proposals-for-interop-2024
- दूसरा लेख: web.dev/blog/interop-2023-wrapup
- तीसरा लेख: web.dev/blog/interop-2024
इनपुट इस तरह दिखना चाहिए:
Context:
Article 1:
Over the past two years... (trimmed)
Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)
Article 3:
Following on from the success of Interop 2022... (trimmed)
Input:
What are the features included in Interop 2024?
इस कॉन्टेक्स्ट से, हमें उम्मीद के मुताबिक नतीजा मिलता है.
* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL
एआई की तकनीकों के बारे में जानने वाले लोगों के लिए, इस तरीके में आरएजी का इस्तेमाल किया जाता है. यह एक सामान्य तरीका है, जिससे जनरेटिव एआई टूल से असल जवाब पाने की संभावना बढ़ जाती है.
सेमेटिक सर्च की मदद से आउटपुट को बेहतर बनाना
आरएजी तकनीक, सामान्य फ़ुल टेक्स्ट सर्च के साथ काम कर सकती है. हालांकि, इस तरीके में कुछ कमियां हैं.
- पूरे टेक्स्ट में खोजने की सुविधा से, एआई को एग्ज़ैक्ट मैच वाले कीवर्ड ढूंढने में मदद मिलती है. हालांकि, एलएलएम किसी व्यक्ति की क्वेरी का मतलब तय नहीं कर पाते हैं. इस वजह से, आउटपुट अधूरे या गलत हो सकते हैं.
- जब शब्दों के कई मतलब होते हैं या क्वेरी में मिलते-जुलते शब्दों का इस्तेमाल किया जाता है, तो समस्याएं आ सकती हैं. उदाहरण के लिए, "बैंक" (वित्तीय संस्थान बनाम नदी का किनारा) से काम के नतीजे नहीं मिल सकते.
- फ़ुल टेक्स्ट सर्च से ऐसे नतीजे मिल सकते हैं जिनमें कीवर्ड शामिल हों, लेकिन वे उपयोगकर्ता के मकसद के मुताबिक न हों.
सेमांटिक सर्च एक ऐसी तकनीक है जिससे खोज के नतीजों को ज़्यादा सटीक बनाया जा सकता है. इसके लिए, इन अहम बातों पर ध्यान दिया जाता है:
- खोज करने वाले व्यक्ति का इंटेंट: इससे यह समझने की कोशिश की जाती है कि कोई व्यक्ति किसी चीज़ को क्यों खोज रहा है. वे क्या खोजने या हासिल करने की कोशिश कर रहे हैं?
- संदर्भ के हिसाब से मतलब: यह शब्दों और वाक्यांशों को उनके आस-पास मौजूद टेक्स्ट से जोड़कर देखता है. इसके अलावा, उपयोगकर्ता की जगह या खोज इतिहास जैसे अन्य फ़ैक्टर के आधार पर भी कॉन्टेंट बनाया जाता है.
- कॉन्सेप्ट के बीच का संबंध: सेमैनटिक सर्च, नॉलेज ग्राफ़ (मिलती-जुलती इकाइयों के बड़े नेटवर्क) और नैचुरल लैंग्वेज प्रोसेसिंग का इस्तेमाल करके यह समझता है कि शब्द और विचार कैसे जुड़े हैं.
इसलिए, जब सेमैनटिक सर्च की मदद से टूल बनाए जाते हैं, तो खोज के नतीजे, कीवर्ड के बजाय क्वेरी के पूरे मकसद पर निर्भर करते हैं. इसका मतलब है कि कोई टूल, काम के दस्तावेज़ों का पता लगा सकता है. भले ही, उसमें सटीक कीवर्ड मौजूद न हो. इससे उन नतीजों को भी हटाया जा सकता है जिनमें शब्द मौजूद है, लेकिन उसका मतलब अलग है.
फ़िलहाल, ऐसे दो सर्च टूल लागू किए जा सकते हैं जिनमें सेमैटिक सर्च का इस्तेमाल किया जाता है: Vertex AI Search और Algolia AI Search.
पब्लिश किए गए कॉन्टेंट से जवाब पाना
आपने प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करके, एलएलएम को ऐसे कॉन्टेंट से जुड़े जवाब देने का तरीका सीखा है जो प्रॉम्प्ट में कॉन्टेक्स्ट जोड़कर नहीं देखा गया है. आपने Retrieval-ऑगमेंटेड जनरेशन (RAG) तकनीक का इस्तेमाल करके, अलग-अलग लेखों से कॉन्टेंट के एक कलेक्शन में इस तरीके को मापने के तरीके के बारे में भी जाना है. आपने जाना कि अपने प्रॉडक्ट में आरएजी को बेहतर तरीके से लागू करके, उपयोगकर्ता की खोज क्वेरी के लिए, सेमैटिक सर्च से नतीजों को और बेहतर कैसे बनाया जा सकता है.
यह एक आम समस्या है कि जनरेटिव एआई टूल "गलत जानकारी" दे सकते हैं. इस वजह से, कभी-कभी इन पर भरोसा नहीं किया जा सकता. इसके अलावा, इनसे कारोबार को नुकसान भी पहुंच सकता है. इन तकनीकों की मदद से, उपयोगकर्ता और डेवलपर, दोनों ही ऐप्लिकेशन के काम करने के तरीके को बेहतर बना सकते हैं. साथ ही, इन ऐप्लिकेशन के आउटपुट पर भरोसा भी बढ़ाया जा सकता है.