AI generatif: Membuat konten baru

Meskipun AI prediktif mengekstrak insight dari data yang ada, AI generatif melangkah lebih jauh dan menciptakan sesuatu yang baru. Model ini dapat menulis teks, membuat gambar, menghasilkan kode, atau bahkan mendesain antarmuka pengguna lengkap. Berikut beberapa contoh kasus penggunaan AI generatif yang umum:

  • Pembuatan konten: Asisten menulis AI dapat membuat draf dan menyempurnakan teks yang ada.
  • Ringkasan: Alat seperti Ringkasan AI Google meringkas dokumen panjang, rapat, atau halaman web menjadi ringkasan yang ringkas dan dapat ditindaklanjuti.
  • Pembuatan kode: Alat developer menggunakan AI generatif untuk menulis dan memfaktorkan ulang kode, sehingga meningkatkan produktivitas developer.
  • Pembuatan gambar dan aset: Dengan menggunakan model vision, pengguna dapat membuat aset visual, seperti banner dan thumbnail.

Loop AI Generatif

Sebagian besar model AI generatif dilatih menggunakan jaringan neural dan arsitektur transformer. Model belajar menyarankan elemen berikutnya dalam urutan, seperti kata, piksel, atau not berikutnya, berdasarkan elemen sebelumnya.

Secara matematis, hal ini tidak jauh berbeda dengan AI prediktif. Keduanya mempelajari pola dari data. Perbedaannya terletak pada skala.

Dalam AI prediktif, opsi output terbatas pada beberapa label, seperti "churn" atau "no churn". Dalam AI generatif, ruang output dapat mencakup ratusan ribu opsi. Setelah dilatih dengan miliaran contoh, mekanisme prediksi berkembang menjadi mesin canggih yang mampu menghasilkan output baru yang belum pernah dilihat.

Pengembangan sistem AI generatif mengikuti pendekatan iteratif.

Setiap langkah mengarah ke langkah berikutnya,
dalam lingkaran yang berkelanjutan.
Gambar 1. Sama seperti loop AI prediktif, Anda memulai dengan menentukan kasus penggunaan. Loop melakukan iterasi melalui setiap langkah dan dimulai lagi.

Kita akan membahas cara kerjanya dengan aplikasi contoh kami, BlogBuddy, yaitu asisten sistem pengelolaan konten yang membantu pengguna membuat deskripsi yang menarik dan judul artikel yang SEO-friendly.

Tentukan kasus penggunaan Anda

Blueprint sistem AI BlogBuddy.
Gambar 2. Cetak biru sistem Anda untuk aplikasi Blogbuddy. Buka diagram berukuran penuh.

Pernyataan masalah Anda harus mencakup:

  • Modalitas input dan output. Input dapat berupa teks (prosa atau kode), gambar, atau audio.
  • Metode input. Apakah konten berasal dari kolom upload, teks bebas, atau input struktur lainnya?
  • Audiens. Siapa yang melakukan tugas ini? Apakah mereka memiliki pengetahuan umum, atau apakah mereka memerlukan pengetahuan khusus?

Fitur BlogBuddy berputar di sekitar pembuatan teks. Inputnya semi-terstruktur: pengguna memberikan topik atau draf singkat, dan model akan menampilkan variasi. Audiensnya adalah tim pemasaran, dengan pengetahuan khusus di bidang editorial.

Penting untuk menetapkan standar kualitas untuk output Anda. Dalam kasus ini, kita ingin membuat teks singkat, mudah dipindai, dan kaya kata kunci yang sesuai dengan gaya bahasa publikasi.

Metrik keberhasilan yang jelas membantu Anda mengarahkan proses selanjutnya. Anda akan mempelajari lebih lanjut cara mengumpulkan metrik keberhasilan dalam Pengembangan yang Didorong Evaluasi.

Pilih model dasar

Ada berbagai model yang tersedia dan telah dilatih sebelumnya dengan set data universal yang besar. Perilakunya dapat disesuaikan untuk kebutuhan tertentu. Model AI generatif biasanya jauh lebih besar dan lebih kompleks daripada model prediktif, jadi sebaiknya Anda membangun di atas model yang sudah ada, daripada membangun dan melatih model Anda sendiri.

Pilihan Anda menentukan kemampuan, biaya, kemampuan penyesuaian, dan batas privasi produk Anda. Pilihan model sangat bergantung pada platform tempat Anda men-deploy sistem AI Anda.

Nanti dalam kursus ini, Anda akan mempelajari cara memilih platform.

Rekayasa perintah dan konteks

Setelah memilih model, Anda perlu memberikan instruksi yang tepat dengan prompt. Untuk BlogBuddy, kita dapat memberikan perintah kepada model sebagai berikut:

Generate three short, engaging title suggestions for this article

Ada beberapa jenis informasi yang dapat Anda tambahkan ke perintah. Contoh:

  • Perintah sistem yang menetapkan perilaku umum.
  • Konteks khusus input untuk tugas saat ini.
  • Petunjuk pengguna dalam aplikasi percakapan, seperti chatbot atau agen.

Inferensi dan pasca-pemrosesan

Setelah perintah Anda disusun, perintah tersebut akan dikirim ke model untuk inferensi. Anda dapat mengubah parameter model, termasuk suhu (untuk kreativitas) dan jumlah maksimum token (untuk panjang dan kejelasan), untuk menyesuaikan cara model merespons. Setelah pembuatan, output sering diproses dengan aturan dan batasan tambahan.

Misalnya, Anda dapat memformulasikan ulang teks yang mengandung bias gender, memoderasi gaya bahasa, atau memfilter istilah yang dilarang.

Untuk mendukung transparansi dan kalibrasi kepercayaan, Anda dapat menambahkan model sekunder yang lebih kecil untuk mengklasifikasikan atau meringkas hasilnya. Misalnya: "Pengantar dibuat dari 12 artikel terkait. Keyakinan: tinggi."

Evaluasi dan feedback loop

Karena ruang output untuk AI generatif hampir tidak terbatas, sebagian besar perintah tidak memiliki satu jawaban yang benar. Benchmark standar, seperti MMLU atau SQuAD, dapat mengukur kemampuan model umum, tetapi jarang mencakup kebutuhan spesifik pengguna manusia. Dalam konteks produk, Anda perlu menentukan kombinasi metrik kualitatif dan kuantitatif Anda sendiri:

  • Akurasi: Apakah outputnya benar secara faktual?
  • Kegunaan: Apakah output memenuhi ekspektasi yang ditetapkan oleh perintah atau maksud pengguna?
  • Keterbacaan dan gaya penulisan: Apakah outputnya jelas dan sesuai dengan standar merek?
  • Upaya manusia: Berapa banyak pengeditan atau kurasi manual yang diperlukan?
  • Pemahaman domain: Apakah output mencerminkan pengetahuan khusus domain?

Untuk mengevaluasi metrik ini, Anda dapat menggabungkan peninjauan manual dan pemberian skor otomatis. Misalnya, Anda dapat meminta pengguna untuk memberi rating pada output dunia nyata, menggunakan model kedua untuk evaluasi otomatis (juga disebut LLM-as-a-judge), dan melakukan peninjauan internal secara berkala untuk mendeteksi bias atau halusinasi.

Data penggunaan sebenarnya adalah salah satu aset terbesar Anda saat membangun dengan generatif. Jika memungkinkan, catat interaksi ini untuk menyesuaikan perintah dan konteks, menguji berbagai model, atau menyesuaikan parameter dari waktu ke waktu. Setiap interaksi pengguna, koreksi, atau rating menjadi masukan yang dapat membantu Anda menentukan langkah-langkah pengoptimalan berikutnya:

  • Input pengguna yang tidak terduga dapat membantu Anda menentukan apakah Anda memecahkan masalah yang tepat.
  • Permintaan khusus domain yang berulang dapat memengaruhi pilihan model. Anda dapat beralih dari LLM umum yang besar ke model kecil yang di-fine-tune.
  • Halusinasi yang sering terjadi dapat menunjukkan kurangnya konteks spesifik dalam perintah Anda.
  • Pengeditan berat dapat menandakan kurangnya konteks bersama. Model tidak mengetahui informasi yang dianggap sudah diketahui oleh pengguna.

Seiring waktu, loop masukan ini mengubah fitur AI generatif Anda dari panggilan model statis menjadi sistem aktif yang terus beradaptasi dengan kebutuhan dan preferensi pengguna Anda.

Kesalahan umum dan mitigasi

Karena AI generatif beroperasi dalam ruang input dan output yang terbuka, permukaan risikonya jauh lebih luas daripada dalam sistem prediktif. Selain menghasilkan output yang salah, model ini dapat menghasilkan konten yang merugikan, bias, atau menyesatkan, atau bahkan memanipulasi pengguna secara tidak sengaja. Kegagalan ini dapat mengikis kepercayaan dan membuat perusahaan Anda menghadapi konsekuensi finansial atau hukum.

Itulah sebabnya AI generatif memerlukan pendekatan manajemen risiko yang proaktif dan berkelanjutan. Berikut beberapa risiko yang paling umum:

  • Halusinasi: Model mengarang fakta atau salah menyatakan detail. Untuk mengurangi risiko, gunakan RAG untuk grounding faktual.
  • Terlalu percaya: Pengguna menganggap output selalu benar. Untuk meminimalkan risiko, dorong alur peninjauan dan pengeditan, bukan publikasi otomatis. Dalam Tata kelola AI: Membangun secara bertanggung jawab, Anda akan mempelajari cara membantu pengguna mengukur kepercayaan mereka.
  • Inkonsistensi: Output sangat bervariasi di berbagai proses. Untuk memitigasi, gunakan template perintah, kontrol suhu, atau contoh sedikit tembakan untuk menstabilkan nada dan struktur.
  • Konten berbahaya atau merugikan: Model menghasilkan teks yang bias, menyinggung, atau manipulatif. Untuk memitigasi, terapkan filter moderasi dan pengklasifikasi toksisitas sebelum ditampilkan. Terus menguji output dengan perintah nyata dan mempertahankan loop masukan untuk menandai dan melatih ulang kasus ekstrem.
  • Latensi dan biaya: Model besar dapat menjadi lambat dan mahal. Terutama jika Anda ingin mengadopsi model dalam skala besar, akan sulit untuk memperkirakan biaya dan penggunaan resource model di awal. Untuk mengurangi dampak, gunakan caching, batching, dan model yang lebih kecil untuk tugas singkat.

Kesimpulan Anda

Singkatnya, AI generatif mengubah ide mentah menjadi konten nyata seperti teks, gambar, kode, atau percakapan. Alat ini sangat berguna jika kreativitas dan kemampuan beradaptasi lebih penting daripada presisi.

Sebagai developer web, kesuksesan Anda bergantung pada perancangan perintah yang tepat, meng-grounding model Anda pada data yang tepat, dan terus menyelaraskan sistem dengan preferensi pengguna.

Resource

Baca tentang memilih model yang lebih kecil dan berkelanjutan. Untuk pembelajaran yang lebih lanjut:

Uji pemahaman Anda

Apa perbedaan utama antara output AI generatif dan AI prediktif?

Output AI generatif terbatas pada beberapa label seperti "churn" atau "tidak churn".
Jawaban Anda salah.
AI generatif membuat konten baru dari ruang output opsi (teks, piksel, kode).
Bagus, jawaban Anda benar.
AI generatif hanya digunakan untuk perkiraan numerik.
Jawaban Anda salah.
AI generatif tidak menggunakan data untuk mempelajari pola.
Jawaban Anda salah.

Apa peran suhu model?

Parameter ini mengontrol keacakan respons model.
Jawaban Anda salah.
Parameter ini menyesuaikan kreativitas respons model.
Bagus, jawaban Anda benar.
Fitur ini memfilter istilah yang dilarang.
Jawaban Anda salah.
Hal ini meningkatkan kecepatan model.
Jawaban Anda salah.

Mengapa tolok ukur standar sering kali tidak cukup untuk mengevaluasi AI generatif?

Biaya untuk menjalankannya terlalu mahal.
Jawaban Anda salah.
Hal ini jarang mencerminkan kebutuhan spesifik pengguna manusia dan maksud produk.
Bagus, jawaban Anda benar.
Fitur ini hanya berfungsi untuk pembuatan gambar, bukan teks.
Jawaban Anda salah.
Soal ini terlalu mudah untuk dilewati oleh model modern.
Jawaban Anda salah.

Manakah berikut ini yang merupakan mitigasi umum untuk halusinasi?

Gunakan teknik seperti RAG (Retrieval-Augmented Generation) untuk melakukan grounding faktual.
Bagus, jawaban Anda benar.
Tingkatkan suhu model untuk membuatnya lebih kreatif.
Jawaban Anda salah.
Berhenti menggunakan AI, dan beralih ke pembuatan konten manual.
Hal ini dapat terjadi, tetapi bukan cara untuk membantu model membuat output yang lebih akurat.
Sembunyikan output dari pengguna jika terlihat mencurigakan.
Meskipun Anda dapat mencoba mencegah informasi palsu menjangkau pengguna, hal ini tidak mengatasi halusinasi yang terus berlanjut.

Apa yang harus Anda lakukan dengan masukan pengguna, menurut loop AI generatif?

Segera hapus untuk melindungi privasi.
Jawaban Anda salah.
Gunakan untuk mempertajam definisi masalah, pilihan model, atau perintah.
Bagus, jawaban Anda benar.
Simpan di database terpisah dan jangan pernah melihatnya.
Jawaban Anda salah.
Gunakan hanya untuk menghukum model atas perilaku buruk.
Jawaban Anda salah.