생성형 AI: 새 콘텐츠 만들기

예측 AI는 기존 데이터에서 인사이트를 추출하는 반면, 생성형 AI는 한 단계 더 나아가 새로운 것을 만듭니다. 텍스트를 작성하거나, 이미지를 생성하거나, 코드를 생성하거나, 전체 사용자 인터페이스를 설계할 수도 있습니다. 다음은 생성형 AI 사용 사례의 몇 가지 일반적인 예입니다.

  • 콘텐츠 제작: AI 글쓰기 어시스턴트는 초안을 작성하고 기존 텍스트를 다듬을 수 있습니다.
  • 요약: Google AI 검색 결과와 같은 도구는 긴 문서, 회의, 웹페이지를 간결하고 실행 가능한 요약으로 압축합니다.
  • 코드 생성: 개발자 도구는 생성형 AI를 사용하여 코드를 작성하고 리팩터링하여 개발자 생산성을 높입니다.
  • 이미지 및 애셋 생성: 사용자는 비전 모델을 사용하여 배너, 썸네일과 같은 시각적 애셋을 생성할 수 있습니다.

생성형 AI 루프

대부분의 생성형 AI 모델은 신경망트랜스포머 아키텍처를 사용하여 학습됩니다. 모델은 이전 요소를 기반으로 시퀀스에서 다음 요소(예: 다음 단어, 픽셀 또는 음표)를 제안하는 방법을 학습합니다.

수학적으로 보면 예측형 AI와 크게 다르지 않습니다. 둘 다 데이터에서 패턴을 학습합니다. 차이점은 규모에 있습니다.

예측 AI에서는 출력 옵션이 '이탈' 또는 '이탈하지 않음'과 같은 몇 가지 라벨로 제한됩니다. 생성형 AI에서 출력 공간에는 수십만 개의 옵션이 포함될 수 있습니다. 수십억 개의 예시로 학습된 예측 메커니즘은 이전에 본 적 없는 새로운 출력을 생성할 수 있는 강력한 엔진으로 발전합니다.

생성형 AI 시스템의 개발은 반복적인 접근 방식을 따릅니다.

각 단계는 연속된 원에서 다음 단계를 가리킵니다.
그림 1. 예측 AI 루프와 마찬가지로 먼저 사용 사례를 정의합니다. 루프는 각 단계를 반복하고 다시 시작합니다.

Google의 샘플 애플리케이션인 BlogBuddy를 통해 이 기능이 어떻게 작동하는지 살펴보겠습니다. BlogBuddy는 사용자가 눈길을 끄는 설명과 SEO 친화적인 기사 제목을 생성하도록 지원하는 콘텐츠 관리 시스템 어시스턴트입니다.

사용 사례 정의

BlogBuddy AI 시스템 청사진
그림 2. Blogbuddy 애플리케이션의 시스템 청사진 전체 크기 다이어그램을 엽니다.

문제 설명에는 다음이 포함되어야 합니다.

  • 입력 및 출력 모달리티 텍스트 (산문 또는 코드), 이미지 또는 오디오일 수 있습니다.
  • 입력 방법 콘텐츠가 업로드 필드, 자유 텍스트 또는 기타 구조 입력에서 가져왔나요?
  • 잠재고객 이 작업을 수행하는 사용자는 누구인가요? 일반 지식이 필요한가요, 아니면 전문 지식이 필요한가요?

BlogBuddy의 기능은 텍스트 생성과 관련이 있습니다. 입력은 반구조화되어 있습니다. 사용자가 주제나 짧은 초안을 제공하면 모델이 변형을 반환합니다. 잠재고객은 마케팅 담당자이며 편집에 대한 전문 지식이 있습니다.

출력에 대한 품질 표준을 설정하는 것이 중요합니다. 이 경우 게시물의 어조에 맞는 짧고, 스캔 가능하며, 키워드가 풍부한 텍스트를 생성하려고 합니다.

명확한 성공 측정항목은 나머지 프로세스를 진행하는 데 도움이 됩니다. 성공 측정항목 수집에 대한 자세한 내용은 평가 기반 개발을 참고하세요.

기본 모델 선택

대규모 범용 데이터 세트로 사전 학습된 다양한 모델을 사용할 수 있습니다. 동작은 특정 요구사항에 맞게 조정할 수 있습니다. 생성형 AI 모델은 일반적으로 예측 모델보다 훨씬 크고 복잡하므로 자체 모델을 빌드하고 학습하는 대신 기존 모델을 기반으로 빌드하는 것이 좋습니다.

선택에 따라 제품의 기능, 비용, 맞춤설정 가능 여부, 개인 정보 보호 경계가 결정됩니다. 모델 선택은 AI 시스템을 배포하는 플랫폼과 매우 상호의존적입니다.

이 과정의 뒷부분에서 플랫폼을 선택하는 방법을 알아봅니다.

프롬프트 및 컨텍스트 엔지니어링

모델을 선택한 후에는 프롬프트와 함께 적절한 안내를 제공해야 합니다. BlogBuddy의 경우 다음과 같이 모델에 프롬프트를 표시할 수 있습니다.

Generate three short, engaging title suggestions for this article

프롬프트에 추가할 수 있는 정보에는 여러 유형이 있습니다. 예를 들면 다음과 같습니다.

  • 일반적인 동작을 설정하는 시스템 프롬프트
  • 현재 작업의 입력 관련 컨텍스트입니다.
  • 챗봇이나 에이전트와 같은 대화형 애플리케이션의 사용자 안내입니다.

추론 및 후처리

프롬프트가 조립되면 추론을 위해 모델로 전송됩니다. 온도 (창의성) 및 최대 토큰 수(길이 및 장황함)를 비롯한 모델 파라미터를 변경하여 모델의 응답 방식을 조정할 수 있습니다. 생성 후 출력은 추가 규칙 및 가드레일로 처리되는 경우가 많습니다.

예를 들어 성별이 지정된 텍스트를 다시 작성하거나, 어조를 조절하거나, 금지된 용어를 필터링할 수 있습니다.

투명성과 신뢰도 보정을 지원하기 위해 결과를 분류하거나 요약하는 더 작은 보조 모델을 추가할 수 있습니다. 예를 들면 다음과 같습니다. '12개의 관련 기사에서 생성된 소개입니다. 신뢰도: 높음.'

평가 및 피드백 루프

생성형 AI의 출력 공간은 사실상 무한하므로 대부분의 프롬프트에는 단일 정답이 없습니다. MMLU 또는 SQuAD와 같은 표준화된 벤치마크는 일반적인 모델 기능을 측정할 수 있지만 인간 사용자의 구체적인 요구사항을 포착하는 경우는 드뭅니다. 제품 컨텍스트에서는 정성적 측정항목과 정량적 측정항목을 직접 정의해야 합니다.

  • 정확성: 출력에 사실적으로 올바른 내용이 포함되어 있나요?
  • 유용성: 출력이 프롬프트 또는 사용자의 의도로 설정된 기대치를 충족하나요?
  • 가독성 및 어조: 출력이 명확하고 브랜드 표준에 부합하나요?
  • 인적 노력: 수동 편집 또는 큐레이션이 얼마나 필요한가요?
  • 도메인 이해: 출력에 도메인별 지식이 반영되어 있나요?

이러한 측정항목을 평가하려면 사람의 검토와 자동 점수 부여를 결합하면 됩니다. 예를 들어 사용자에게 실제 출력을 평가하도록 요청하고, 자동 평가를 위해 두 번째 모델 (LLM-as-a-judge이라고도 함)을 사용하고, 편향 또는 환각에 대해 주기적인 내부 검토를 수행할 수 있습니다.

생성형 AI로 빌드할 때 실제 사용 데이터는 가장 큰 자산 중 하나입니다. 가능하다면 이러한 상호작용을 기록하여 프롬프트와 컨텍스트를 조정하고, 다양한 모델을 테스트하거나, 시간이 지남에 따라 파라미터를 조정하세요. 각 사용자 상호작용, 수정 또는 평가는 다음 최적화 단계를 결정하는 데 도움이 되는 의견이 됩니다.

  • 예상치 못한 사용자 입력은 올바른 문제를 해결하고 있는지 확인하는 데 도움이 됩니다.
  • 반복되는 도메인별 요청은 모델 선택에 영향을 줄 수 있습니다. 크고 일반적인 LLM에서 작고 미세 조정된 모델로 전환할 수 있습니다.
  • 환각이 자주 발생하면 프롬프트에 구체적인 맥락이 부족하다는 의미일 수 있습니다.
  • 과도한 수정은 공유된 컨텍스트가 부족하다는 신호일 수 있습니다. 모델은 사용자가 당연하게 여기는 정보를 알지 못합니다.

시간이 지남에 따라 이러한 피드백 루프는 생성형 AI 기능을 정적 모델 호출에서 사용자의 요구사항과 선호도에 지속적으로 적응하는 라이브 시스템으로 변환합니다.

일반적인 문제 및 완화

생성형 AI는 입력과 출력의 개방형 공간에서 작동하므로 위험 표면이 예측 시스템보다 훨씬 넓습니다. 잘못된 출력을 생성하는 것 외에도 유해하거나, 편향되거나, 오해의 소지가 있는 콘텐츠를 생성하거나 의도치 않게 사용자를 조작할 수도 있습니다. 이러한 실패는 신뢰를 떨어뜨리고 회사에 재정적 또는 법적 결과를 초래할 수 있습니다.

따라서 생성형 AI에는 사전 예방적이고 지속적인 위험 관리 접근 방식이 필요합니다. 가장 일반적인 위험은 다음과 같습니다.

  • 할루시네이션: 모델이 사실을 조작하거나 세부정보를 잘못 진술합니다. 이 문제를 완화하려면 사실에 기반한 그라운딩에 RAG를 사용하세요.
  • 과도한 신뢰: 사용자가 출력이 항상 올바르다고 가정합니다. 이 문제를 완화하려면 자동 게시 대신 검토 및 수정 흐름을 권장하세요. AI 거버넌스: 책임감 있는 구축에서는 사용자가 신뢰를 조정하도록 돕는 방법을 알아봅니다.
  • 불일치: 실행마다 출력이 크게 다릅니다. 이를 완화하려면 프롬프트 템플릿, 온도 제어 또는 퓨샷 예시를 사용하여 어조와 구조를 안정화하세요.
  • 유해하거나 불쾌감을 주는 콘텐츠: 모델이 편향되거나 불쾌감을 주거나 조작적인 텍스트를 생성합니다. 이를 완화하려면 표시 전에 조정 필터와 유해성 분류기를 적용하세요. 실제 프롬프트로 출력을 지속적으로 테스트하고 피드백 루프를 유지하여 특이 사례를 신고하고 재학습합니다.
  • 지연 시간 및 비용: 대규모 모델은 속도가 느리고 비용이 많이 들 수 있습니다. 특히 대규모 도입을 목표로 하는 경우 모델의 비용과 리소스 사용량을 미리 추정하기 어려울 수 있습니다. 이를 완화하려면 짧은 작업에 캐싱, 배치, 더 작은 모델을 사용하세요.

핵심 내용

간단히 말해 생성형 AI는 아이디어를 텍스트, 이미지, 코드, 대화와 같은 구체적인 콘텐츠로 변환합니다. 정확성보다 창의성과 적응성이 중요한 곳에서 빛을 발합니다.

웹 개발자의 성공 여부는 적절한 프롬프트를 설계하고, 적절한 데이터로 모델을 그라운딩하고, 시스템을 사용자 환경설정에 지속적으로 맞추는 데 달려 있습니다.

리소스

더 작고 지속 가능한 모델 선택에 대해 알아보세요. 고급 학습을 위한 자료:

이해도 확인

생성형 AI와 예측형 AI 출력의 주요 차이점은 무엇인가요?

생성형 AI 출력은 '이탈' 또는 '이탈 없음'과 같은 몇 가지 라벨로 제한됩니다.
오답입니다.
생성형 AI는 옵션 (텍스트, 픽셀, 코드)의 출력 공간에서 새로운 콘텐츠를 생성합니다.
잘하셨습니다. 정답입니다.
생성형 AI는 숫자 예측에만 사용됩니다.
오답입니다.
생성형 AI는 데이터를 사용하여 패턴을 학습하지 않습니다.
오답입니다.

모델 온도의 역할은 무엇인가요?

모델의 대답의 무작위성을 제어합니다.
오답입니다.
모델의 대답의 창의성을 조정합니다.
잘하셨습니다. 정답입니다.
금지된 용어를 필터링합니다.
오답입니다.
모델의 속도를 높입니다.
오답입니다.

표준화된 벤치마크가 생성형 AI를 평가하는 데 충분하지 않은 이유는 무엇인가요?

실행 비용이 너무 비쌉니다.
오답입니다.
인간 사용자의 구체적인 요구사항과 제품 의도를 포착하는 경우는 드뭅니다.
잘하셨습니다. 정답입니다.
이미지 생성에만 사용할 수 있으며 텍스트에는 사용할 수 없습니다.
오답입니다.
최신 모델이 통과하기에는 너무 쉽습니다.
오답입니다.

다음 중 일반적인 텍스트 생성 오류 완화 방법은 무엇인가요?

사실에 기반한 그라운딩을 위해 RAG (검색 증강 생성)와 같은 기법을 사용하세요.
잘하셨습니다. 정답입니다.
모델의 온도를 높여 더 창의적으로 만드세요.
오답입니다.
AI 사용을 중지하고 수동 콘텐츠 제작으로 전환합니다.
이러한 현상이 발생할 수 있지만 모델이 더 정확한 출력을 생성하는 데 도움이 되지는 않습니다.
의심스러워 보이는 경우 사용자에게 출력을 숨깁니다.
사용자에게 거짓 정보가 표시되지 않도록 할 수는 있지만 지속적인 환각 현상을 해결하지는 못합니다.

생성형 AI 루프에 따르면 사용자 의견을 어떻게 처리해야 하나요?

개인 정보 보호를 위해 즉시 삭제하세요.
오답입니다.
이를 사용하여 문제 정의, 모델 선택 또는 프롬프트를 개선하세요.
잘하셨습니다. 정답입니다.
별도의 데이터베이스에 저장하고 절대 확인하지 마세요.
오답입니다.
비정상적인 동작에 대해 모델을 처벌하는 데만 사용하세요.
오답입니다.