이 페이지는 Cloud Translation API를 통해 번역되었습니다.

WebRTC 시작하기

Sam Dutton

WebRTC는 개방적이고 제약이 없는 웹을 위한 오랜 전쟁의 새로운 전선입니다.
브렌던 아이크, JavaScript 발명가

플러그인 없는 실시간 통신

휴대전화, TV, 컴퓨터가 공통 플랫폼에서 소통할 수 있는 세상을 상상해 보세요. 웹 앱에 영상 채팅과 P2P 데이터 공유를 쉽게 추가할 수 있다고 상상해 보세요. 이것이 WebRTC의 비전입니다.

이 기능을 사용해 보려면 WebRTC는 데스크톱 및 모바일에서 Google Chrome, Safari, Firefox, Opera를 통해 사용할 수 있습니다. appr.tc의 간단한 영상 채팅 앱부터 시작하는 것이 좋습니다.

브라우저에서 appr.tc를 엽니다.
참여를 클릭하여 채팅방에 참여하고 앱에서 웹캠을 사용하도록 허용합니다.
페이지 끝에 표시된 URL을 새 탭에서 열거나 다른 컴퓨터에서 여는 것이 좋습니다.

빠른 시작

이 도움말을 읽을 시간이 없거나 코드만 필요한가요?

WebRTC 개요를 보려면 다음 Google I/O 동영상을 시청하거나 이 슬라이드를 확인하세요.
getUserMedia API를 사용하지 않은 경우 HTML5에서 오디오 및 동영상 캡처 및 simpl.info getUserMedia를 참고하세요.
RTCPeerConnection API에 대해 알아보려면 다음 예와 'simpl.info RTCPeerConnection'을 참고하세요.
WebRTC가 신호 전송, 방화벽 및 NAT 순회에 서버를 사용하는 방법을 알아보려면 appr.tc의 코드와 콘솔 로그를 참고하세요.
기다릴 수 없고 지금 바로 WebRTC를 사용해 보고 싶으신가요? WebRTC JavaScript API를 사용하는 20개가 넘는 데모를 사용해 보세요.
머신 및 WebRTC에 문제가 있나요? WebRTC 문제 해결 도구를 방문하세요.

또는 간단한 시그널링 서버를 비롯한 완전한 화상 채팅 앱을 빌드하는 방법을 설명하는 단계별 가이드인 WebRTC Codelab으로 바로 이동하세요.

WebRTC의 매우 짧은 역사

웹의 마지막 주요 과제 중 하나는 음성 및 동영상을 통한 인간 커뮤니케이션, 즉 실시간 커뮤니케이션(RTC)을 지원하는 것입니다. RTC는 웹 앱에서 텍스트 입력에 텍스트를 입력하는 것만큼 자연스러워야 합니다. 이러한 도구가 없으면 혁신하고 사용자가 상호작용할 수 있는 새로운 방법을 개발하는 데 제한이 있습니다.

이전에는 RTC가 기업용으로 복잡하여 라이선스를 받거나 사내에서 개발한 값비싼 오디오 및 동영상 기술이 필요했습니다. 특히 웹에서 RTC 기술을 기존 콘텐츠, 데이터, 서비스와 통합하는 것은 어렵고 시간이 오래 걸렸습니다.

Gmail 영상 채팅은 2008년에 인기를 얻었으며, 2011년에 Google은 Gmail과 마찬가지로 Talk를 사용하는 행아웃을 도입했습니다. Google은 코덱, 에코 제거 기술 등 RTC에 필요한 여러 구성요소를 개발한 회사인 GIPS를 인수했습니다. Google은 GIPS에서 개발한 기술을 오픈소스로 제공하고 인터넷 엔지니어링 태스크 포스 (IETF) 및 월드와이드웹 컨소시엄 (W3C)의 관련 표준 기관과 협력하여 업계의 합의를 이끌어냈습니다. 2011년 5월 Ericsson은 WebRTC의 첫 번째 구현을 빌드했습니다.

WebRTC는 플러그인 없는 실시간 동영상, 오디오, 데이터 통신을 위한 개방형 표준을 구현했습니다. 필요는 실제였습니다.

많은 웹 서비스에서 RTC를 사용했지만 다운로드, 네이티브 앱 또는 플러그인이 필요했습니다. 여기에는 Skype, Facebook, 행아웃이 포함됩니다.
플러그인을 다운로드, 설치, 업데이트하는 것은 복잡하고 오류가 발생하기 쉬우며 짜증스럽습니다.
플러그인은 배포, 디버깅, 문제 해결, 테스트, 유지보수가 어렵고 복잡하고 비용이 많이 드는 기술과의 라이선스 및 통합이 필요할 수 있습니다. 사람들이 플러그인을 설치하도록 설득하는 것 자체가 어려운 경우가 많습니다.

WebRTC 프로젝트의 기본 원칙은 API가 오픈소스이고, 무료이며, 표준화되어 있고, 웹브라우저에 내장되어 있으며, 기존 기술보다 효율적이어야 한다는 것입니다.

지금 어디에 있지?

WebRTC는 Google Meet과 같은 다양한 앱에서 사용됩니다. WebRTC는 WebKitGTK+ 및 Qt 네이티브 앱과도 통합되었습니다.

WebRTC는 다음 세 가지 API를 구현합니다. - MediaStream (getUserMedia이라고도 함) - RTCPeerConnection - RTCDataChannel

API는 다음 두 사양에 정의되어 있습니다.

세 가지 API 모두 Chrome, Safari, Firefox, Edge, Opera에서 모바일과 데스크톱을 지원합니다.

getUserMedia: 데모 및 코드는 WebRTC 샘플을 참고하거나 getUserMedia을 웹 오디오의 입력으로 사용하는 Chris Wilson의 놀라운 예를 참고하세요.

RTCPeerConnection: 간단한 데모와 완전한 기능을 갖춘 영상 채팅 앱은 각각 WebRTC 샘플 피어 연결과 appr.tc를 참고하세요. 이 앱은 Google에서 WebRTC 커뮤니티의 도움을 받아 유지관리하는 JavaScript shim인 adapter.js를 사용하여 브라우저 차이와 사양 변경사항을 추상화합니다.

RTCDataChannel: 실제로 작동하는 모습을 보려면 WebRTC 샘플에서 데이터 채널 데모 중 하나를 확인하세요.

WebRTC Codelab에서는 세 가지 API를 모두 사용하여 영상 채팅 및 파일 공유를 위한 간단한 앱을 빌드하는 방법을 보여줍니다.

첫 번째 WebRTC

WebRTC 앱은 다음과 같은 작업을 실행해야 합니다.

스트리밍 오디오, 동영상 또는 기타 데이터를 가져옵니다.
IP 주소, 포트와 같은 네트워크 정보를 가져와 다른 WebRTC 클라이언트 (피어라고 함)와 교환하여 NAT 및 방화벽을 통해서도 연결할 수 있습니다.
오류를 보고하고 세션을 시작하거나 닫기 위해 신호 통신을 조정합니다.
해상도, 코덱 등 미디어 및 클라이언트 기능에 관한 정보를 교환합니다.
스트리밍 오디오, 동영상 또는 데이터를 통신합니다.

스트리밍 데이터를 획득하고 통신하기 위해 WebRTC는 다음 API를 구현합니다.

MediaStream는 사용자 카메라 및 마이크와 같은 데이터 스트림에 액세스할 수 있습니다.
RTCPeerConnection을 사용하면 암호화 및 대역폭 관리 기능으로 오디오 또는 영상 통화를 할 수 있습니다.
RTCDataChannel은 일반 데이터의 피어 투 피어 통신을 지원합니다.

(WebRTC의 네트워크 및 신호 측면에 대한 자세한 내용은 뒷부분에 나와 있습니다.)

`MediaStream` API (`getUserMedia` API라고도 함)

MediaStream API는 동기화된 미디어 스트림을 나타냅니다. 예를 들어 카메라와 마이크 입력에서 가져온 스트림에는 동기화된 동영상 및 오디오 트랙이 있습니다. (MediaStreamTrack을 <track> 요소와 혼동하지 마세요. <track> 요소는 완전히 다른 요소입니다.)

MediaStream API를 이해하는 가장 쉬운 방법은 실제 사용 사례를 살펴보는 것입니다.

브라우저에서 WebRTC 샘플 getUserMedia로 이동합니다.
Console을 엽니다.
전역 범위에 있는 stream 변수를 검사합니다.

각 MediaStream에는 입력(getUserMedia()에서 생성된 MediaStream일 수 있음)과 출력(동영상 요소 또는 RTCPeerConnection에 전달될 수 있음)이 있습니다.

getUserMedia() 메서드는 MediaStreamConstraints 객체 매개변수를 사용하고 MediaStream 객체로 확인되는 Promise를 반환합니다.

각 MediaStream에는 'Xk7EuLhsuHKbnjLWkW4yYGNJJ8ONsgwHBvLQ'와 같은 label가 있습니다. getAudioTracks() 및 getVideoTracks() 메서드는 MediaStreamTrack 배열을 반환합니다.

getUserMedia 예시에서 stream.getAudioTracks()는 빈 배열을 반환하고 (오디오가 없으므로) 작동하는 웹캠이 연결되어 있다고 가정하면 stream.getVideoTracks()는 웹캠의 스트림을 나타내는 MediaStreamTrack 하나로 구성된 배열을 반환합니다. 각 MediaStreamTrack에는 종류 ('video' 또는 'audio')와 label (예: 'FaceTime HD Camera (Built-in)')가 있으며 오디오 또는 동영상의 하나 이상의 채널을 나타냅니다. 이 경우 동영상 트랙은 하나이고 오디오는 없지만 전면 카메라, 후면 카메라, 마이크, 화면을 공유하는 앱에서 스트림을 가져오는 채팅 앱과 같이 트랙이 더 많은 사용 사례를 쉽게 상상할 수 있습니다.

srcObject 속성을 설정하여 MediaStream을 동영상 요소에 연결할 수 있습니다. 이전에는 src 속성을 URL.createObjectURL()로 생성된 객체 URL로 설정하여 이를 수행했지만 이 방법은 지원 중단되었습니다.

참고: MediaStreamTrack는 카메라를 적극적으로 사용하여 리소스를 사용하고 카메라를 열고 카메라 표시등을 켜둡니다. 트랙을 더 이상 사용하지 않는 경우 카메라를 닫을 수 있도록 track.stop()를 호출해야 합니다.

getUserMedia는 Web Audio API의 입력 노드로도 사용할 수 있습니다.

// Cope with browser differences.
let audioContext;
if (typeof AudioContext === 'function') {
  audioContext = new AudioContext();
} else if (typeof webkitAudioContext === 'function') {
  audioContext = new webkitAudioContext(); // eslint-disable-line new-cap
} else {
  console.log('Sorry! Web Audio not supported.');
}

// Create a filter node.
var filterNode = audioContext.createBiquadFilter();
// See https://dvcs.w3.org/hg/audio/raw-file/tip/webaudio/specification.html#BiquadFilterNode-section
filterNode.type = 'highpass';
// Cutoff frequency. For highpass, audio is attenuated below this frequency.
filterNode.frequency.value = 10000;

// Create a gain node to change audio volume.
var gainNode = audioContext.createGain();
// Default is 1 (no change). Less than 1 means audio is attenuated
// and vice versa.
gainNode.gain.value = 0.5;

navigator.mediaDevices.getUserMedia({audio: true}, (stream) => {
  // Create an AudioNode from the stream.
  const mediaStreamSource =
    audioContext.createMediaStreamSource(stream);
  mediaStreamSource.connect(filterNode);
  filterNode.connect(gainNode);
  // Connect the gain node to the destination. For example, play the sound.
  gainNode.connect(audioContext.destination);
});

Chromium 기반 앱과 확장 프로그램도 getUserMedia를 통합할 수 있습니다. 매니페스트에 audioCapture 또는 videoCapture 권한을 추가하면 설치 시 권한을 한 번만 요청하고 부여할 수 있습니다. 이후에는 사용자에게 카메라 또는 마이크 액세스 권한을 요청하지 않습니다.

getUserMedia()의 경우 권한은 한 번만 부여하면 됩니다. 처음에는 브라우저의 정보 표시줄에 허용 버튼이 표시됩니다. getUserMedia()의 HTTP 액세스는 강력한 기능으로 분류되어 2015년 말에 Chrome에서 지원 중단되었습니다.

카메라나 마이크뿐 아니라 모든 스트리밍 데이터 소스에 MediaStream를 사용 설정하는 것이 목표일 수 있습니다. 이렇게 하면 저장된 데이터 또는 센서나 기타 입력과 같은 임의 데이터 소스에서 스트리밍할 수 있습니다.

getUserMedia()는 다른 JavaScript API 및 라이브러리와 함께 사용할 때 진가를 발휘합니다.

Webcam Toy는 WebGL을 사용하여 사진에 기이하고 멋진 효과를 추가하는 포토 부스 앱으로, 사진을 공유하거나 로컬에 저장할 수 있습니다.
FaceKat은 headtrackr.js로 빌드된 얼굴 추적 게임입니다.
ASCII 카메라는 Canvas API를 사용하여 ASCII 이미지를 생성합니다.

idevelop.ro/ascii-camera에서 생성된 ASCII 이미지 — gUM ASCII 아트

제약조건

제약 조건을 사용하여 getUserMedia()의 동영상 해상도 값을 설정할 수 있습니다. 또한 가로세로 비율, 방향 모드 (전면 또는 후면 카메라), 프레임 속도, 높이 및 너비, applyConstraints() 메서드와 같은 기타 제약 조건 지원도 허용합니다.

예를 들어 WebRTC 샘플 getUserMedia: 해상도 선택을 참고하세요.

주의: getUserMedia 제약 조건은 공유 리소스의 사용 가능한 구성에 영향을 줄 수 있습니다. 예를 들어 한 탭에서 카메라를 640x480 모드로 연 경우 다른 탭에서는 한 모드로만 열 수 있으므로 제약 조건을 사용하여 더 높은 해상도 모드로 열 수 없습니다. 이는 구현 세부정보입니다. 두 번째 탭에서 더 높은 해상도 모드로 카메라를 다시 열고 동영상 처리를 사용하여 첫 번째 탭의 동영상 트랙을 640x480으로 다운스케일할 수 있지만 이는 구현되지 않았습니다.

허용되지 않는 제약 조건 값을 설정하면 요청된 해상도를 사용할 수 없는 경우와 같이 DOMException 또는 OverconstrainedError이 제공됩니다. 실제 작동을 확인하려면 WebRTC 샘플 getUserMedia: 해상도 선택에서 데모를 확인하세요.

화면 및 탭 캡처

Chrome 앱을 사용하면 chrome.tabCapture 및 chrome.desktopCapture API를 통해 단일 브라우저 탭 또는 전체 데스크톱의 라이브 동영상을 공유할 수도 있습니다. 데모 및 자세한 내용은 WebRTC를 사용한 화면 공유를 참고하세요. 이 기사는 몇 년 전에 작성되었지만 여전히 흥미롭습니다.)

실험용 chromeMediaSource 제약 조건을 사용하여 Chrome에서 화면 캡처를 MediaStream 소스로 사용할 수도 있습니다. 화면 캡처에는 HTTPS가 필요하며 이 게시물에 설명된 대로 명령줄 플래그를 통해 사용 설정되므로 개발에만 사용해야 합니다.

시그널링: 세션 제어, 네트워크, 미디어 정보

WebRTC는 RTCPeerConnection를 사용하여 브라우저 (피어라고도 함) 간에 스트리밍 데이터를 통신하지만 통신을 조정하고 제어 메시지를 전송하는 메커니즘도 필요합니다. 이 프로세스를 시그널링이라고 합니다. 신호 메서드와 프로토콜은 WebRTC에서 지정하지 않습니다. 시그널링은 RTCPeerConnection API의 일부가 아닙니다.

대신 WebRTC 앱 개발자는 SIP나 XMPP와 같은 원하는 메시지 프로토콜과 적절한 양방향 통신 채널을 선택할 수 있습니다. appr.tc 예에서는 XHR과 채널 API를 신호 메커니즘으로 사용합니다. codelab에서는 Node 서버에서 실행되는 Socket.io를 사용합니다.

시그널링은 다음 세 가지 유형의 정보를 교환하는 데 사용됩니다.

세션 제어 메시지: 통신을 초기화하거나 닫고 오류를 보고합니다.
네트워크 구성: 외부에서 볼 때 컴퓨터의 IP 주소와 포트는 무엇인가요?
미디어 기능: 브라우저와 통신하려는 브라우저에서 처리할 수 있는 코덱과 해상도

피어 투 피어 스트리밍을 시작하려면 신호 전송을 통한 정보 교환이 성공적으로 완료되어야 합니다.

예를 들어 Alice가 Bob과 통신하려고 한다고 가정해 보겠습니다. 다음은 W3C WebRTC 사양의 코드 샘플로, 실제 신호 프로세스를 보여줍니다. 이 코드는 createSignalingChannel() 메서드에서 생성된 일부 신호 메커니즘이 있다고 가정합니다. Chrome 및 Opera에서는 현재 RTCPeerConnection에 접두사가 붙습니다.

// handles JSON.stringify/parse
const signaling = new SignalingChannel();
const constraints = {audio: true, video: true};
const configuration = {iceServers: [{urls: 'stun:stun.example.org'}]};
const pc = new RTCPeerConnection(configuration);

// Send any ice candidates to the other peer.
pc.onicecandidate = ({candidate}) => signaling.send({candidate});

// Let the "negotiationneeded" event trigger offer generation.
pc.onnegotiationneeded = async () => {
  try {
    await pc.setLocalDescription(await pc.createOffer());
    // Send the offer to the other peer.
    signaling.send({desc: pc.localDescription});
  } catch (err) {
    console.error(err);
  }
};

// Once remote track media arrives, show it in remote video element.
pc.ontrack = (event) => {
  // Don't set srcObject again if it is already set.
  if (remoteView.srcObject) return;
  remoteView.srcObject = event.streams[0];
};

// Call start() to initiate.
async function start() {
  try {
    // Get local stream, show it in self-view, and add it to be sent.
    const stream =
      await navigator.mediaDevices.getUserMedia(constraints);
    stream.getTracks().forEach((track) =>
      pc.addTrack(track, stream));
    selfView.srcObject = stream;
  } catch (err) {
    console.error(err);
  }
}

signaling.onmessage = async ({desc, candidate}) => {
  try {
    if (desc) {
      // If you get an offer, you need to reply with an answer.
      if (desc.type === 'offer') {
        await pc.setRemoteDescription(desc);
        const stream =
          await navigator.mediaDevices.getUserMedia(constraints);
        stream.getTracks().forEach((track) =>
          pc.addTrack(track, stream));
        await pc.setLocalDescription(await pc.createAnswer());
        signaling.send({desc: pc.localDescription});
      } else if (desc.type === 'answer') {
        await pc.setRemoteDescription(desc);
      } else {
        console.log('Unsupported SDP type.');
      }
    } else if (candidate) {
      await pc.addIceCandidate(candidate);
    }
  } catch (err) {
    console.error(err);
  }
};

먼저 앨리스와 밥이 네트워크 정보를 교환합니다. (후보 찾기라는 표현은 ICE 프레임워크를 사용하여 네트워크 인터페이스와 포트를 찾는 프로세스를 의미합니다.)

앨리스는 네트워크 후보를 사용할 수 있게 되면 실행되는 onicecandidate 핸들러를 사용하여 RTCPeerConnection 객체를 만듭니다.
앨리스는 WebSocket 또는 기타 메커니즘과 같은 사용 중인 신호 채널을 통해 직렬화된 후보 데이터를 밥에게 전송합니다.
Bob이 Alice로부터 후보 메시지를 받으면 addIceCandidate를 호출하여 후보를 원격 피어 설명에 추가합니다.

WebRTC 클라이언트 (이 예에서는 피어 또는 Alice와 Bob)는 해상도 및 코덱 기능과 같은 로컬 및 원격 오디오와 동영상 미디어 정보도 확인하고 교환해야 합니다. 미디어 구성 정보를 교환하기 위한 신호는 세션 설명 프로토콜 (SDP)을 사용하여 offer와 answer를 교환하여 진행됩니다.

앨리스가 RTCPeerConnection createOffer() 메서드를 실행합니다. 여기에서 반환된 값은 RTCSessionDescription(앨리스의 로컬 세션 설명)에 전달됩니다.
콜백에서 Alice는 setLocalDescription()을 사용하여 로컬 설명을 설정한 다음 시그널링 채널을 통해 이 세션 설명을 Bob에게 전송합니다. setLocalDescription()이 호출될 때까지 RTCPeerConnection가 후보를 수집하지 않습니다. 이는 JSEP IETF 초안에 체계적으로 정리되어 있습니다.
Bob은 setRemoteDescription()를 사용하여 Alice가 보낸 설명을 원격 설명으로 설정합니다.
밥은 앨리스로부터 받은 원격 설명을 전달하여 RTCPeerConnection createAnswer() 메서드를 실행하여 앨리스의 세션과 호환되는 로컬 세션을 생성합니다. createAnswer() 콜백에는 RTCSessionDescription가 전달됩니다. 밥은 이를 로컬 설명으로 설정하고 앨리스에게 전송합니다.
Alice가 Bob의 세션 설명을 가져오면 setRemoteDescription를 사용하여 이를 원격 설명으로 설정합니다.
핑!

참고: 더 이상 필요하지 않을 때 close()를 호출하여 RTCPeerConnection가 가비지 컬렉션되도록 허용해야 합니다. 그렇지 않으면 스레드와 연결이 활성 상태로 유지됩니다. WebRTC에서 과도한 리소스가 누출될 수 있습니다.

RTCSessionDescription 객체는 세션 설명 프로토콜(SDP)을 준수하는 블롭입니다. 직렬화된 SDP 객체는 다음과 같습니다.

v=0
o=- 3883943731 1 IN IP4 127.0.0.1
s=
t=0 0
a=group:BUNDLE audio video
m=audio 1 RTP/SAVPF 103 104 0 8 106 105 13 126

// ...

a=ssrc:2223794119 label:H4fjnMzxy3dPIgQ7HxuCTLb4wLLLeRHnFxh810

네트워크 및 미디어 정보의 획득 및 교환은 동시에 이루어질 수 있지만, 피어 간 오디오 및 동영상 스트리밍이 시작되기 전에 두 프로세스가 모두 완료되어야 합니다.

앞서 설명한 제안/응답 아키텍처를 JavaScript 세션 설정 프로토콜(JSEP)이라고 합니다. (첫 번째 WebRTC 구현을 위한 Ericsson 데모 동영상에 신호 전송 및 스트리밍 프로세스를 설명하는 훌륭한 애니메이션이 있습니다.)

시그널링 프로세스가 성공적으로 완료되면 발신자와 수신자 간에 직접 P2P로 데이터를 스트리밍할 수 있습니다. 이 방법이 실패하면 중개 릴레이 서버를 통해 스트리밍할 수 있습니다 (자세한 내용은 나중에 설명). 스트리밍은 RTCPeerConnection의 작업입니다.

RTCPeerConnection

RTCPeerConnection는 피어 간 스트리밍 데이터의 안정적이고 효율적인 통신을 처리하는 WebRTC 구성요소입니다.

다음은 RTCPeerConnection의 역할을 보여주는 WebRTC 아키텍처 다이어그램입니다. 보시다시피 녹색 부분은 복잡합니다.

JavaScript 관점에서 이 다이어그램에서 이해해야 할 주요 사항은 RTCPeerConnection가 웹 개발자를 숨겨진 수많은 복잡성으로부터 보호한다는 것입니다. WebRTC에서 사용하는 코덱과 프로토콜은 신뢰할 수 없는 네트워크에서도 실시간 통신이 가능하도록 많은 작업을 수행합니다.

패킷 손실 은폐
에코 제거
대역폭 적응성
동적 지터 버퍼링
입력 신호량 자동 조절
노이즈 감소 및 제거
이미지 정리

이전 W3C 코드는 신호 관점에서 WebRTC의 단순화된 예를 보여줍니다. 다음은 작동하는 두 WebRTC 앱의 연습입니다. 첫 번째는 RTCPeerConnection를 보여주는 간단한 예이고 두 번째는 완전히 작동하는 영상 채팅 클라이언트입니다.

서버 없는 RTCPeerConnection

다음 코드는 한 웹페이지에 로컬 및 원격 RTCPeerConnection (및 로컬 및 원격 동영상)이 있는 WebRTC 샘플 피어 연결에서 가져온 것입니다. 이는 매우 유용한 것은 아닙니다. 호출자와 피호출자가 동일한 페이지에 있기 때문입니다. 하지만 페이지의 RTCPeerConnection 객체가 중개 신호 메커니즘을 사용하지 않고도 직접 데이터와 메시지를 교환할 수 있으므로 RTCPeerConnection API의 작동 방식을 좀 더 명확하게 파악할 수 있습니다.

이 예시에서 pc1는 로컬 피어 (호출자)를 나타내고 pc2는 원격 피어 (피호출자)를 나타냅니다.

발신자

새 RTCPeerConnection를 만들고 getUserMedia()에서 스트림을 추가합니다. ```js // Servers is an optional configuration file. (TURN 및 STUN에 관한 내용은 나중에 설명합니다.) pc1 = new RTCPeerConnection(servers); // ... localStream.getTracks().forEach((track) => { pc1.addTrack(track, localStream); });

오퍼를 만들고 pc1의 로컬 설명으로, pc2의 원격 설명으로 설정합니다. 호출자와 수신자가 모두 동일한 페이지에 있으므로 시그널링을 사용하지 않고 코드에서 직접 이 작업을 수행할 수 있습니다. js pc1.setLocalDescription(desc).then(() => { onSetLocalSuccess(pc1); }, onSetSessionDescriptionError ); trace('pc2 setRemoteDescription start'); pc2.setRemoteDescription(desc).then(() => { onSetRemoteSuccess(pc2); }, onSetSessionDescriptionError );

Callee

pc2를 만들고 pc1의 스트림이 추가되면 동영상 요소에 표시합니다. js pc2 = new RTCPeerConnection(servers); pc2.ontrack = gotRemoteStream; //... function gotRemoteStream(e){ vid2.srcObject = e.stream; }

`RTCPeerConnection` API 및 서버

실제로는 WebRTC에 서버가 필요하므로 다음과 같은 상황이 발생할 수 있습니다.

사용자가 서로를 발견하고 이름과 같은 실제 세부정보를 교환합니다.
WebRTC 클라이언트 앱 (피어)이 네트워크 정보를 교환합니다.
피어가 동영상 형식 및 해상도와 같은 미디어에 관한 데이터를 교환합니다.
WebRTC 클라이언트 앱은 NAT 게이트웨이와 방화벽을 통과합니다.

즉, WebRTC에는 다음과 같은 네 가지 유형의 서버 측 기능이 필요합니다.

사용자 검색 및 커뮤니케이션
신호
NAT/방화벽 순회
피어 투 피어 통신이 실패하는 경우 중계 서버

NAT 트래버설, 피어 투 피어 네트워킹, 사용자 검색 및 신호 전송을 위한 서버 앱 빌드 요구사항은 이 도움말의 범위를 벗어납니다. STUN 프로토콜과 그 확장 프로그램인 TURN은 ICE 프레임워크에서 RTCPeerConnection가 NAT 순회 및 기타 네트워크 변동에 대처할 수 있도록 하는 데 사용됩니다.

ICE는 두 개의 영상 채팅 클라이언트와 같은 피어를 연결하는 프레임워크입니다. 처음에 ICE는 UDP를 통해 지연 시간이 가장 짧은 피어를 직접 연결하려고 시도합니다. 이 과정에서 STUN 서버는 NAT 뒤에 있는 피어가 공개 주소와 포트를 찾을 수 있도록 지원하는 단일 작업을 수행합니다. (STUN 및 TURN에 관한 자세한 내용은 WebRTC 앱에 필요한 백엔드 서비스 빌드를 참고하세요.)

UDP가 실패하면 ICE는 TCP를 시도합니다. 직접 연결이 실패하는 경우(특히 엔터프라이즈 NAT 순회 및 방화벽으로 인해) ICE는 중개(릴레이) TURN 서버를 사용합니다. 즉, ICE는 먼저 UDP와 함께 STUN을 사용하여 피어를 직접 연결하고, 실패하면 TURN 릴레이 서버로 대체합니다. 후보 찾기라는 표현은 네트워크 인터페이스와 포트를 찾는 프로세스를 의미합니다.

WebRTC 엔지니어인 Justin Uberti는 2013 Google I/O WebRTC 프레젠테이션에서 ICE, STUN, TURN에 관한 자세한 정보를 제공합니다. (프레젠테이션 슬라이드에는 TURN 및 STUN 서버 구현 예가 나와 있습니다.)

간단한 영상 채팅 클라이언트

STUN 서버를 사용하여 신호 및 NAT/방화벽 순회를 완료하는 WebRTC를 사용해 보기에 좋은 곳은 appr.tc의 영상 채팅 데모입니다. 이 앱은 사양 변경사항과 접두사 차이로부터 앱을 보호하는 shim인 adapter.js를 사용합니다.

코드는 로깅에서 의도적으로 장황합니다. 콘솔을 확인하여 이벤트 순서를 파악합니다. 다음은 코드에 관한 자세한 설명입니다.

네트워크 토폴로지

현재 구현된 WebRTC는 일대일 통신만 지원하지만, 각 피어가 서로 직접 또는 다중 포인트 제어 장치 (MCU)를 통해 통신하는 여러 피어와 같은 더 복잡한 네트워크 시나리오에서 사용할 수 있습니다. MCU는 많은 수의 참여자를 처리하고 선택적 스트림 전달, 오디오 및 동영상 혼합 또는 녹화를 할 수 있는 서버입니다.

Multipoint Control Unit 토폴로지 다이어그램 — 다지점 제어 장치 토폴로지 예

기존 WebRTC 앱은 웹브라우저 간 통신만 보여주지만 게이트웨이 서버를 사용하면 브라우저에서 실행되는 WebRTC 앱이 전화 (PSTN이라고도 함) 및 VOIP 시스템과 같은 기기와 상호작용할 수 있습니다. 2012년 5월 Doubango Telecom은 WebRTC와 WebSocket으로 빌드된 sipml5 SIP 클라이언트를 오픈소스로 제공했습니다. 이 클라이언트는 (다른 잠재적 용도 중) iOS 및 Android에서 실행되는 브라우저와 앱 간의 영상 통화를 지원합니다. Google I/O에서 Tethr와 Tropo는 OpenBTS 셀을 사용하여 WebRTC를 통해 피처폰과 컴퓨터 간의 통신을 지원하는 서류 가방에 들어가는 재난 통신 프레임워크를 시연했습니다. 이동통신사 없이 전화 통신!

Google I/O 2012의 Tethr/Tropo 데모 — Tethr/Tropo: 서류 가방에 담긴 재난 통신

`RTCDataChannel` API<

오디오 및 동영상 외에도 WebRTC는 다른 유형의 데이터에 대한 실시간 통신을 지원합니다.

RTCDataChannel API를 사용하면 짧은 지연 시간과 높은 처리량으로 임의의 데이터를 피어 간에 교환할 수 있습니다. 단일 페이지 데모와 간단한 파일 전송 앱을 빌드하는 방법을 알아보려면 각각 WebRTC 샘플과 WebRTC Codelab을 참고하세요.

API의 잠재적인 사용 사례는 다음과 같습니다.

게임
원격 데스크톱 앱
실시간 텍스트 채팅
파일 전송
분산형 네트워크

이 API에는 RTCPeerConnection를 최대한 활용하고 강력하고 유연한 피어 투 피어 통신을 지원하는 여러 기능이 있습니다.

RTCPeerConnection 세션 설정 활용
우선순위가 지정된 여러 동시 채널
신뢰할 수 있는 전송 시맨틱과 신뢰할 수 없는 전송 시맨틱
내장 보안 (DTLS) 및 혼잡 제어
오디오 또는 동영상 유무와 관계없이 사용 가능

문법은 send() 메서드와 message 이벤트가 있는 WebSocket과 의도적으로 유사합니다.

const localConnection = new RTCPeerConnection(servers);
const remoteConnection = new RTCPeerConnection(servers);
const sendChannel =
  localConnection.createDataChannel('sendDataChannel');

// ...

remoteConnection.ondatachannel = (event) => {
  receiveChannel = event.channel;
  receiveChannel.onmessage = onReceiveMessage;
  receiveChannel.onopen = onReceiveChannelStateChange;
  receiveChannel.onclose = onReceiveChannelStateChange;
};

function onReceiveMessage(event) {
  document.querySelector("textarea#send").value = event.data;
}

document.querySelector("button#send").onclick = () => {
  var data = document.querySelector("textarea#send").value;
  sendChannel.send(data);
};

통신은 브라우저 간에 직접 이루어지므로 방화벽과 NAT에 대응하기 위해 홀 펀칭이 실패할 때 릴레이 (TURN) 서버가 필요한 경우에도 RTCDataChannel가 WebSocket보다 훨씬 빠를 수 있습니다.

RTCDataChannel은 Chrome, Safari, Firefox, Opera, Samsung Internet에서 사용할 수 있습니다. Cube Slam 게임은 API를 사용하여 게임 상태를 전달합니다. 친구와 함께 플레이하거나 곰과 함께 플레이하세요. 혁신적인 플랫폼인 Sharefest는 RTCDataChannel를 통한 파일 공유를 지원했으며 peerCDN은 WebRTC가 P2P 콘텐츠 배포를 지원하는 방법을 보여주었습니다.

RTCDataChannel에 대한 자세한 내용은 IETF의 초안 프로토콜 사양을 참고하세요.

보안

실시간 통신 앱 또는 플러그인이 보안을 위협할 수 있는 방법은 여러 가지가 있습니다. 예를 들면 다음과 같습니다.

암호화되지 않은 미디어나 데이터는 브라우저 간 또는 브라우저와 서버 간에 가로채질 수 있습니다.
앱이 사용자가 모르는 사이에 동영상이나 오디오를 녹화하고 배포할 수 있습니다.
겉으로는 무해해 보이는 플러그인이나 앱과 함께 멀웨어 또는 바이러스가 설치될 수 있습니다.

WebRTC에는 이러한 문제를 방지하는 여러 기능이 있습니다.

WebRTC 구현에서는 DTLS 및 SRTP와 같은 보안 프로토콜을 사용합니다.
신호 메커니즘을 비롯한 모든 WebRTC 구성요소에 암호화가 필수입니다.
WebRTC는 플러그인이 아닙니다. 구성요소는 별도의 프로세스가 아닌 브라우저 샌드박스에서 실행됩니다. 구성요소는 별도의 설치가 필요하지 않으며 브라우저가 업데이트될 때마다 업데이트됩니다.
카메라 및 마이크 액세스 권한은 명시적으로 부여해야 하며 카메라나 마이크가 실행 중일 때는 사용자 인터페이스에 명확하게 표시됩니다.

스트리밍 미디어의 보안에 대한 자세한 내용은 이 도움말의 범위를 벗어납니다. 자세한 내용은 IETF에서 제안한 제안된 WebRTC 보안 아키텍처를 참고하세요.

결론

WebRTC의 API와 표준은 전화 통신, 게임, 동영상 제작, 음악 제작, 뉴스 수집 등 콘텐츠 제작 및 커뮤니케이션 도구를 민주화하고 분산화할 수 있습니다.

이보다 더 파괴적인 기술은 없습니다.

블로거 Phil Edholm이 말한 것처럼 'WebRTC와 HTML5는 원래 브라우저가 정보에 대해 수행한 것과 동일한 변환을 실시간 커뮤니케이션에 대해 수행할 수 있습니다.'

개발자 도구

진행 중인 세션의 WebRTC 통계는 다음에서 확인할 수 있습니다.
- Chrome의 about://webrtc-internals
- Opera의 opera://webrtc-internals
- Firefox의 about:webrtc
  
  chrome://webrtc-internals 스크린샷
크로스 브라우저 상호 운용성 참고사항
adapter.js는 WebRTC 커뮤니티의 도움을 받아 Google에서 유지관리하는 WebRTC용 JavaScript shim으로, 공급업체 접두사, 브라우저 차이, 사양 변경사항을 추상화합니다.
WebRTC 신호 프로세스에 대해 자세히 알아보려면 콘솔에서 appr.tc 로그 출력을 확인하세요.
이 모든 것이 너무 많다면 WebRTC 프레임워크 또는 완전한 WebRTC 서비스를 사용하는 것이 좋습니다.
버그 신고 및 기능 요청은 언제나 환영합니다.

자세히 알아보기

Google I/O 2012의 Justin Uberti WebRTC 세션
Alan B. 존스턴과 다니엘 C. 버넷은 현재 인쇄 및 eBook 형식으로 세 번째 버전이 나와 있는 WebRTC 책을 webrtcbook.com에서 관리하고 있습니다.
webrtc.org에는 데모, 문서, 토론 등 WebRTC에 관한 모든 것이 있습니다.
discuss-webrtc는 기술적인 WebRTC 토론을 위한 Google 그룹입니다.
@webrtc
Google Developers Talk 문서에서는 NAT 트래버설, STUN, 릴레이 서버, 후보 수집에 관한 자세한 정보를 제공합니다.
GitHub의 WebRTC
Stack Overflow는 WebRTC에 대한 답변을 찾고 질문을 올리기에 좋은 곳입니다.

표준 및 프로토콜

WebRTC W3C 편집자 초안
W3C 편집자 초안: 미디어 캡처 및 스트림 (getUserMedia라고도 함)
IETF 실무 그룹 헌장
IETF WebRTC 데이터 채널 프로토콜 초안
IETF JSEP 초안
ICE에 대한 IETF 제안 표준
IETF RTCWEB 작업 그룹 인터넷 초안: WebRTC 사용 사례 및 요구사항

WebRTC 지원 요약

`MediaStream` 및 `getUserMedia` API

Chrome 데스크톱 18.0.1008 이상, Android용 Chrome 29 이상
Opera 18 이상, Android용 Opera 20 이상
Opera 12, Opera Mobile 12 (Presto 엔진 기반)
Firefox 17 이상
Microsoft Edge 16 이상
iOS의 Safari 11.2 이상, MacOS의 Safari 11.1 이상
Android의 UC 11.8 이상
Samsung Internet 4 이상

`RTCPeerConnection` API

Chrome 데스크톱 20 이상, Android용 Chrome 29 이상 (플래그 없음)
Opera 18 이상 (기본적으로 사용 설정됨), Opera for Android 20 이상 (기본적으로 사용 설정됨)
Firefox 22 이상 (기본적으로 사용 설정됨)
Microsoft Edge 16 이상
iOS의 Safari 11.2 이상, MacOS의 Safari 11.1 이상
Samsung Internet 4 이상

`RTCDataChannel` API

Chrome 25에서는 실험 버전이지만 Chrome 26 이상에서는 더 안정적이며 Firefox 상호 운용성이 있습니다. Chrome (Android용) 29 이상
Opera 18 이상, Opera for Android 20 이상에서 안정화 버전 (Firefox 상호 운용성 포함)
Firefox 22 이상 (기본적으로 사용 설정됨)

getUserMedia, RTCPeerConnection과 같은 API의 크로스 플랫폼 지원에 관한 자세한 내용은 caniuse.com 및 Chrome 플랫폼 상태를 참고하세요.

RTCPeerConnection용 네이티브 API는 webrtc.org의 문서에서도 확인할 수 있습니다.

WebRTC 시작하기 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

플러그인 없는 실시간 통신

빠른 시작

WebRTC의 매우 짧은 역사

지금 어디에 있지?

첫 번째 WebRTC

MediaStream API (getUserMedia API라고도 함)

제약조건

화면 및 탭 캡처

시그널링: 세션 제어, 네트워크, 미디어 정보

RTCPeerConnection

서버 없는 RTCPeerConnection

발신자

Callee

RTCPeerConnection API 및 서버

간단한 영상 채팅 클라이언트

네트워크 토폴로지

RTCDataChannel API<

보안

결론

개발자 도구

자세히 알아보기

표준 및 프로토콜

WebRTC 지원 요약

MediaStream 및 getUserMedia API

RTCPeerConnection API

RTCDataChannel API

WebRTC 시작하기

`MediaStream` API (`getUserMedia` API라고도 함)

`RTCPeerConnection` API 및 서버

`RTCDataChannel` API<

`MediaStream` 및 `getUserMedia` API

`RTCPeerConnection` API

`RTCDataChannel` API