उपयोगकर्ता का ऑडियो रिकॉर्ड कर रहा है

Paul Kinlan

अब कई ब्राउज़र, उपयोगकर्ता से वीडियो और ऑडियो इनपुट ऐक्सेस कर सकते हैं. हालांकि, ब्राउज़र के हिसाब से, यह पूरी तरह डाइनैमिक और इनलाइन अनुभव हो सकता है. इसके अलावा, इसे उपयोगकर्ता के डिवाइस पर मौजूद किसी दूसरे ऐप्लिकेशन को भी सौंपा जा सकता है.

आसानी से और धीरे-धीरे शुरू करें

सबसे आसान तरीका यह है कि उपयोगकर्ता से पहले से रिकॉर्ड की गई फ़ाइल मांगी जाए. ऐसा करने के लिए, एक आसान फ़ाइल इनपुट एलिमेंट बनाएं. साथ ही, एक accept फ़िल्टर जोड़ें, जिससे पता चलता हो कि हम सिर्फ़ ऑडियो फ़ाइलें स्वीकार कर सकते हैं. इसके अलावा, एक capture एट्रिब्यूट जोड़ें, जिससे पता चलता हो कि हमें इसे सीधे माइक्रोफ़ोन से चाहिए.

<input type="file" accept="audio/*" capture />

यह तरीका सभी प्लैटफ़ॉर्म पर काम करता है. डेस्कटॉप पर, यह उपयोगकर्ता से फ़ाइल सिस्टम से कोई फ़ाइल अपलोड करने के लिए कहेगा. इसमें capture एट्रिब्यूट को अनदेखा किया जाएगा. iOS पर Safari में, यह माइक्रोफ़ोन ऐप्लिकेशन खोलेगा. इससे, ऑडियो रिकॉर्ड करके उसे वेब पेज पर भेजा जा सकता है. Android पर, यह उपयोगकर्ता को यह चुनने का विकल्प देगा कि वेब पेज पर भेजने से पहले, ऑडियो को किस ऐप्लिकेशन से रिकॉर्ड करना है.

जब उपयोगकर्ता रिकॉर्डिंग पूरी कर लेता है और वह वेबसाइट पर वापस आ जाता है, तो आपको किसी तरह से फ़ाइल का डेटा हासिल करना होगा. इनपुट एलिमेंट में onchange इवेंट अटैच करके और फिर इवेंट ऑब्जेक्ट की files प्रॉपर्टी पढ़कर, तुरंत ऐक्सेस किया जा सकता है.

<input type="file" accept="audio/*" capture id="recorder" />
<audio id="player" controls></audio>
  <script>
    const recorder = document.getElementById('recorder');
    const player = document.getElementById('player');

    recorder.addEventListener('change', function (e) {
      const file = e.target.files[0];
      const url = URL.createObjectURL(file);
      // Do something with the audio file.
      player.src = url;
    });
  </script>
</audio>

फ़ाइल का ऐक्सेस मिलने के बाद, उसमें अपनी पसंद के मुताबिक बदलाव किए जा सकते हैं. उदाहरण के लिए, ये काम किए जा सकते हैं:

इसे सीधे <audio> एलिमेंट से अटैच करें, ताकि इसे चलाया जा सके
उसे उपयोगकर्ता के डिवाइस पर डाउनलोड करें
इसे XMLHttpRequest से अटैच करके, सर्वर पर अपलोड करें
इसे Web Audio API के ज़रिए पास करें और उस पर फ़िल्टर लागू करें

ऑडियो डेटा का ऐक्सेस पाने के लिए, इनपुट एलिमेंट का तरीका इस्तेमाल करना आम बात है. हालांकि, यह सबसे कम पसंद किया जाने वाला विकल्प है. हम माइक्रोफ़ोन का ऐक्सेस पाना चाहते हैं, ताकि हम सीधे पेज पर ही बेहतर अनुभव दे सकें.

इंटरैक्टिव तरीके से माइक्रोफ़ोन ऐक्सेस करना

आधुनिक ब्राउज़र में माइक्रोफ़ोन से सीधे तौर पर कनेक्ट करने की सुविधा होती है. इससे, हम ऐसे अनुभव बना सकते हैं जो वेब पेज के साथ पूरी तरह से इंटिग्रेट होते हैं और उपयोगकर्ता को ब्राउज़र से कभी बाहर नहीं जाना पड़ता.

माइक्रोफ़ोन का ऐक्सेस पाना

हम getUserMedia() नाम के WebRTC स्पेसिफ़िकेशन में मौजूद एपीआई का इस्तेमाल करके, माइक्रोफ़ोन को सीधे ऐक्सेस कर सकते हैं. getUserMedia(), उपयोगकर्ता से कनेक्ट किए गए माइक्रोफ़ोन और कैमरों को ऐक्सेस करने के लिए कहेगा.

अगर एपीआई काम करता है, तो वह एक Stream दिखाएगा. इसमें कैमरे या माइक्रोफ़ोन का डेटा होगा. इसके बाद, हम इसे <audio> एलिमेंट, WebRTC स्ट्रीम या वेब ऑडियो AudioContext से अटैच कर सकते हैं. इसके अलावा, MediaRecorder एपीआई का इस्तेमाल करके इसे सेव भी किया जा सकता है.

माइक्रोफ़ोन से डेटा पाने के लिए, हम getUserMedia() एपीआई को भेजे गए constraints ऑब्जेक्ट में audio: true सेट करते हैं.

<audio id="player" controls></audio>
<script>
  const player = document.getElementById('player');

  const handleSuccess = function (stream) {
    if (window.URL) {
      player.srcObject = stream;
    } else {
      player.src = stream;
    }
  };

  navigator.mediaDevices
    .getUserMedia({audio: true, video: false})
    .then(handleSuccess);
</script>

अगर आपको कोई खास माइक्रोफ़ोन चुनना है, तो पहले उपलब्ध माइक्रोफ़ोन की सूची देखें.

navigator.mediaDevices.enumerateDevices().then((devices) => {
  devices = devices.filter((d) => d.kind === 'audioinput');
});

इसके बाद, getUserMedia को कॉल करते समय उस deviceId का इस्तेमाल किया जा सकता है जिसका इस्तेमाल करना है.

navigator.mediaDevices.getUserMedia({
  audio: {
    deviceId: devices[0].deviceId,
  },
});

यह अपने-आप इतना काम का नहीं है. हम सिर्फ़ ऑडियो डेटा को लेकर उसे फिर से चला सकते हैं.

माइक्रोफ़ोन से रॉ डेटा ऐक्सेस करना

माइक्रोफ़ोन से रॉ डेटा ऐक्सेस करने के लिए, हमें getUserMedia() की बनाई गई स्ट्रीम लेनी होगी. इसके बाद, डेटा को प्रोसेस करने के लिए, Web Audio API का इस्तेमाल करना होगा. Web Audio API एक आसान एपीआई है. यह इनपुट सोर्स लेता है और उन सोर्स को नोड से कनेक्ट करता है. ये नोड, ऑडियो डेटा को प्रोसेस कर सकते हैं. जैसे, गेन में बदलाव करना वगैरह. आखिर में, यह डेटा स्पीकर से कनेक्ट होता है, ताकि उपयोगकर्ता उसे सुन सके.

कनेक्ट किए जा सकने वाले नोड में से एक AudioWorkletNode है. इस नोड की मदद से, ऑडियो को पसंद के मुताबिक प्रोसेस करने की सुविधा मिलती है. ऑडियो की असल प्रोसेसिंग, AudioWorkletProcessor में process() कॉलबैक वाले तरीके से होती है. इनपुट और पैरामीटर फ़ीड करने और आउटपुट फ़ेच करने के लिए, इस फ़ंक्शन को कॉल करें.

ज़्यादा जानने के लिए, ऑडियो वर्कलेट डालें देखें.

<script>
  const handleSuccess = async function(stream) {
    const context = new AudioContext();
    const source = context.createMediaStreamSource(stream);

    await context.audioWorklet.addModule("processor.js");
    const worklet = new AudioWorkletNode(context, "worklet-processor");

    source.connect(worklet);
    worklet.connect(context.destination);
  };

  navigator.mediaDevices.getUserMedia({ audio: true, video: false })
      .then(handleSuccess);
</script>

// processor.js
class WorkletProcessor extends AudioWorkletProcessor {
  process(inputs, outputs, parameters) {
    // Do something with the data, e.g. convert it to WAV
    console.log(inputs);
    return true;
  }
}

registerProcessor("worklet-processor", WorkletProcessor);

बफ़र में सेव किया गया डेटा, माइक्रोफ़ोन से मिला रॉ डेटा होता है. इस डेटा का इस्तेमाल कई कामों के लिए किया जा सकता है:

इसे सीधे सर्वर पर अपलोड करें
इसे डिवाइस पर सेव करना
इसे WAV जैसे किसी खास फ़ाइल फ़ॉर्मैट में बदलें और फिर इसे अपने सर्वर या लोकल स्टोरेज में सेव करें

माइक्रोफ़ोन से डेटा सेव करना

माइक्रोफ़ोन से डेटा सेव करने का सबसे आसान तरीका, MediaRecorder एपीआई का इस्तेमाल करना है.

MediaRecorder API, getUserMedia से बनाई गई स्ट्रीम को लेगा. इसके बाद, स्ट्रीम में मौजूद डेटा को आपके पसंदीदा डेस्टिनेशन में धीरे-धीरे सेव करेगा.

<a id="download">Download</a>
<button id="stop">Stop</button>
<script>
  const downloadLink = document.getElementById('download');
  const stopButton = document.getElementById('stop');


  const handleSuccess = function(stream) {
    const options = {mimeType: 'audio/webm'};
    const recordedChunks = [];
    const mediaRecorder = new MediaRecorder(stream, options);

    mediaRecorder.addEventListener('dataavailable', function(e) {
      if (e.data.size > 0) recordedChunks.push(e.data);
    });

    mediaRecorder.addEventListener('stop', function() {
      downloadLink.href = URL.createObjectURL(new Blob(recordedChunks));
      downloadLink.download = 'acetest.wav';
    });

    stopButton.addEventListener('click', function() {
      mediaRecorder.stop();
    });

    mediaRecorder.start();
  };

  navigator.mediaDevices.getUserMedia({ audio: true, video: false })
      .then(handleSuccess);
</script>

हमारे मामले में, हम डेटा को सीधे किसी ऐरे में सेव कर रहे हैं, जिसे बाद में Blob में बदला जा सकता है. इसके बाद, इस डेटा को अपने वेब सर्वर या सीधे उपयोगकर्ता के डिवाइस के स्टोरेज में सेव किया जा सकता है.

माइक्रोफ़ोन का ज़िम्मेदारी से इस्तेमाल करने के लिए अनुमति मांगना

अगर उपयोगकर्ता ने पहले कभी आपकी साइट को माइक्रोफ़ोन का ऐक्सेस नहीं दिया है, तो getUserMedia को कॉल करने के तुरंत बाद, ब्राउज़र उपयोगकर्ता को आपकी साइट को माइक्रोफ़ोन का ऐक्सेस देने के लिए कहेगा.

उपयोगकर्ताओं को अपनी मशीन पर बेहतरीन डिवाइसों का ऐक्सेस पाने के लिए, बार-बार अनुरोध मिलने से परेशानी होती है. इसलिए, वे अक्सर अनुरोध को ब्लॉक कर देते हैं. इसके अलावा, अगर उन्हें यह समझ नहीं आता कि अनुरोध किस संदर्भ में बनाया गया है, तो वे उसे अनदेखा कर देते हैं. सबसे सही तरीका यह है कि माइक्रोफ़ोन को सिर्फ़ तब ऐक्सेस करने के लिए कहा जाए, जब ज़रूरत हो. उपयोगकर्ता से ऐक्सेस मिलने के बाद, आपसे फिर से अनुमति नहीं मांगी जाएगी. हालांकि, अगर उपयोगकर्ता ऐक्सेस देने से मना कर देता है, तो आपके पास उससे फिर से अनुमति मांगने का विकल्प नहीं होगा.

आपके पास पहले से ऐक्सेस है या नहीं, यह देखने के लिए अनुमतियां एपीआई का इस्तेमाल करना

getUserMedia एपीआई से आपको यह जानकारी नहीं मिलती कि आपके पास पहले से माइक्रोफ़ोन का ऐक्सेस है या नहीं. इससे आपको एक समस्या आती है. उपयोगकर्ता को माइक्रोफ़ोन का ऐक्सेस देने के लिए, आपको एक अच्छा यूज़र इंटरफ़ेस (यूआई) उपलब्ध कराना होगा. इसके लिए, आपको माइक्रोफ़ोन का ऐक्सेस मांगना होगा.

कुछ ब्राउज़र में, Permission API का इस्तेमाल करके इस समस्या को हल किया जा सकता है. navigator.permission एपीआई की मदद से, किसी खास एपीआई को ऐक्सेस करने की स्थिति के बारे में क्वेरी की जा सकती है. इसके लिए, आपको फिर से अनुरोध करने की ज़रूरत नहीं पड़ती.

उपयोगकर्ता के माइक्रोफ़ोन का ऐक्सेस है या नहीं, यह जानने के लिए क्वेरी के तरीके में {name: 'microphone'} डालें. इससे आपको इनमें से कोई एक नतीजा मिलेगा:

granted — उपयोगकर्ता ने पहले ही आपको माइक्रोफ़ोन का ऐक्सेस दिया हो;
prompt — उपयोगकर्ता ने आपको ऐक्सेस नहीं दिया है और getUserMedia पर कॉल करने पर, उसे सूचना दी जाएगी;
denied — सिस्टम या उपयोगकर्ता ने माइक्रोफ़ोन का ऐक्सेस साफ़ तौर पर ब्लॉक कर दिया है. इसलिए, आपको इसका ऐक्सेस नहीं मिलेगा.

अब यह तुरंत देखा जा सकता है कि उपयोगकर्ता को जो कार्रवाइयां करनी हैं उनके लिए, आपको अपने यूज़र इंटरफ़ेस में बदलाव करने की ज़रूरत है या नहीं.

navigator.permissions.query({name: 'microphone'}).then(function (result) {
  if (result.state == 'granted') {
  } else if (result.state == 'prompt') {
  } else if (result.state == 'denied') {
  }
  result.onchange = function () {};
});