Meskipun AI prediktif mengekstrak insight dari data yang ada, AI generatif melangkah lebih jauh dan menciptakan sesuatu yang baru. Model ini dapat menulis teks, membuat gambar, menghasilkan kode, atau bahkan mendesain antarmuka pengguna lengkap. Berikut beberapa contoh kasus penggunaan AI generatif yang umum:
- Pembuatan konten: Asisten menulis AI dapat membuat draf dan menyempurnakan teks yang ada.
- Ringkasan: Alat seperti Ringkasan AI Google meringkas dokumen panjang, rapat, atau halaman web menjadi ringkasan yang ringkas dan dapat ditindaklanjuti.
- Pembuatan kode: Alat developer menggunakan AI generatif untuk menulis dan memfaktorkan ulang kode, sehingga meningkatkan produktivitas developer.
- Pembuatan gambar dan aset: Dengan menggunakan model vision, pengguna dapat membuat aset visual, seperti banner dan thumbnail.
Loop AI Generatif
Sebagian besar model AI generatif dilatih menggunakan jaringan neural dan arsitektur transformer. Model belajar menyarankan elemen berikutnya dalam urutan, seperti kata, piksel, atau not berikutnya, berdasarkan elemen sebelumnya.
Secara matematis, hal ini tidak jauh berbeda dengan AI prediktif. Keduanya mempelajari pola dari data. Perbedaannya terletak pada skala.
Dalam AI prediktif, opsi output terbatas pada beberapa label, seperti "churn" atau "no churn". Dalam AI generatif, ruang output dapat mencakup ratusan ribu opsi. Setelah dilatih dengan miliaran contoh, mekanisme prediksi berkembang menjadi mesin canggih yang mampu menghasilkan output baru yang belum pernah dilihat.
Pengembangan sistem AI generatif mengikuti pendekatan iteratif.
Kita akan membahas cara kerjanya dengan aplikasi contoh kami, BlogBuddy, yaitu asisten sistem pengelolaan konten yang membantu pengguna membuat deskripsi yang menarik dan judul artikel yang SEO-friendly.
Tentukan kasus penggunaan Anda
Pernyataan masalah Anda harus mencakup:
- Modalitas input dan output. Input dapat berupa teks (prosa atau kode), gambar, atau audio.
- Metode input. Apakah konten berasal dari kolom upload, teks bebas, atau input struktur lainnya?
- Audiens. Siapa yang melakukan tugas ini? Apakah mereka memiliki pengetahuan umum, atau apakah mereka memerlukan pengetahuan khusus?
Fitur BlogBuddy berputar di sekitar pembuatan teks. Inputnya semi-terstruktur: pengguna memberikan topik atau draf singkat, dan model akan menampilkan variasi. Audiensnya adalah tim pemasaran, dengan pengetahuan khusus di bidang editorial.
Penting untuk menetapkan standar kualitas untuk output Anda. Dalam kasus ini, kita ingin membuat teks singkat, mudah dipindai, dan kaya kata kunci yang sesuai dengan gaya bahasa publikasi.
Metrik keberhasilan yang jelas membantu Anda mengarahkan proses selanjutnya. Anda akan mempelajari lebih lanjut cara mengumpulkan metrik keberhasilan dalam Pengembangan yang Didorong Evaluasi.
Pilih model dasar
Ada berbagai model yang tersedia dan telah dilatih sebelumnya dengan set data universal yang besar. Perilakunya dapat disesuaikan untuk kebutuhan tertentu. Model AI generatif biasanya jauh lebih besar dan lebih kompleks daripada model prediktif, jadi sebaiknya Anda membangun di atas model yang sudah ada, daripada membangun dan melatih model Anda sendiri.
Pilihan Anda menentukan kemampuan, biaya, kemampuan penyesuaian, dan batas privasi produk Anda. Pilihan model sangat bergantung pada platform tempat Anda men-deploy sistem AI Anda.
Nanti dalam kursus ini, Anda akan mempelajari cara memilih platform.
Rekayasa perintah dan konteks
Setelah memilih model, Anda perlu memberikan instruksi yang tepat dengan prompt. Untuk BlogBuddy, kita dapat memberikan perintah kepada model sebagai berikut:
Generate three short, engaging title suggestions for this article
Ada beberapa jenis informasi yang dapat Anda tambahkan ke perintah. Contoh:
- Perintah sistem yang menetapkan perilaku umum.
- Konteks khusus input untuk tugas saat ini.
- Petunjuk pengguna dalam aplikasi percakapan, seperti chatbot atau agen.
Inferensi dan pasca-pemrosesan
Setelah perintah Anda disusun, perintah tersebut akan dikirim ke model untuk inferensi. Anda dapat mengubah parameter model, termasuk suhu (untuk kreativitas) dan jumlah maksimum token (untuk panjang dan kejelasan), untuk menyesuaikan cara model merespons. Setelah pembuatan, output sering diproses dengan aturan dan batasan tambahan.
Misalnya, Anda dapat memformulasikan ulang teks yang mengandung bias gender, memoderasi gaya bahasa, atau memfilter istilah yang dilarang.
Untuk mendukung transparansi dan kalibrasi kepercayaan, Anda dapat menambahkan model sekunder yang lebih kecil untuk mengklasifikasikan atau meringkas hasilnya. Misalnya: "Pengantar dibuat dari 12 artikel terkait. Keyakinan: tinggi."
Evaluasi dan feedback loop
Karena ruang output untuk AI generatif hampir tidak terbatas, sebagian besar perintah tidak memiliki satu jawaban yang benar. Benchmark standar, seperti MMLU atau SQuAD, dapat mengukur kemampuan model umum, tetapi jarang mencakup kebutuhan spesifik pengguna manusia. Dalam konteks produk, Anda perlu menentukan kombinasi metrik kualitatif dan kuantitatif Anda sendiri:
- Akurasi: Apakah outputnya benar secara faktual?
- Kegunaan: Apakah output memenuhi ekspektasi yang ditetapkan oleh perintah atau maksud pengguna?
- Keterbacaan dan gaya penulisan: Apakah outputnya jelas dan sesuai dengan standar merek?
- Upaya manusia: Berapa banyak pengeditan atau kurasi manual yang diperlukan?
- Pemahaman domain: Apakah output mencerminkan pengetahuan khusus domain?
Untuk mengevaluasi metrik ini, Anda dapat menggabungkan peninjauan manual dan pemberian skor otomatis. Misalnya, Anda dapat meminta pengguna untuk memberi rating pada output dunia nyata, menggunakan model kedua untuk evaluasi otomatis (juga disebut LLM-as-a-judge), dan melakukan peninjauan internal secara berkala untuk mendeteksi bias atau halusinasi.
Data penggunaan sebenarnya adalah salah satu aset terbesar Anda saat membangun dengan generatif. Jika memungkinkan, catat interaksi ini untuk menyesuaikan perintah dan konteks, menguji berbagai model, atau menyesuaikan parameter dari waktu ke waktu. Setiap interaksi pengguna, koreksi, atau rating menjadi masukan yang dapat membantu Anda menentukan langkah-langkah pengoptimalan berikutnya:
- Input pengguna yang tidak terduga dapat membantu Anda menentukan apakah Anda memecahkan masalah yang tepat.
- Permintaan khusus domain yang berulang dapat memengaruhi pilihan model. Anda dapat beralih dari LLM umum yang besar ke model kecil yang di-fine-tune.
- Halusinasi yang sering terjadi dapat menunjukkan kurangnya konteks spesifik dalam perintah Anda.
- Pengeditan berat dapat menandakan kurangnya konteks bersama. Model tidak mengetahui informasi yang dianggap sudah diketahui oleh pengguna.
Seiring waktu, loop masukan ini mengubah fitur AI generatif Anda dari panggilan model statis menjadi sistem aktif yang terus beradaptasi dengan kebutuhan dan preferensi pengguna Anda.
Kesalahan umum dan mitigasi
Karena AI generatif beroperasi dalam ruang input dan output yang terbuka, permukaan risikonya jauh lebih luas daripada dalam sistem prediktif. Selain menghasilkan output yang salah, model ini dapat menghasilkan konten yang merugikan, bias, atau menyesatkan, atau bahkan memanipulasi pengguna secara tidak sengaja. Kegagalan ini dapat mengikis kepercayaan dan membuat perusahaan Anda menghadapi konsekuensi finansial atau hukum.
Itulah sebabnya AI generatif memerlukan pendekatan manajemen risiko yang proaktif dan berkelanjutan. Berikut beberapa risiko yang paling umum:
- Halusinasi: Model mengarang fakta atau salah menyatakan detail. Untuk mengurangi risiko, gunakan RAG untuk grounding faktual.
- Terlalu percaya: Pengguna menganggap output selalu benar. Untuk meminimalkan risiko, dorong alur peninjauan dan pengeditan, bukan publikasi otomatis. Dalam Tata kelola AI: Membangun secara bertanggung jawab, Anda akan mempelajari cara membantu pengguna mengukur kepercayaan mereka.
- Inkonsistensi: Output sangat bervariasi di berbagai proses. Untuk memitigasi, gunakan template perintah, kontrol suhu, atau contoh sedikit tembakan untuk menstabilkan nada dan struktur.
- Konten berbahaya atau merugikan: Model menghasilkan teks yang bias, menyinggung, atau manipulatif. Untuk memitigasi, terapkan filter moderasi dan pengklasifikasi toksisitas sebelum ditampilkan. Terus menguji output dengan perintah nyata dan mempertahankan loop masukan untuk menandai dan melatih ulang kasus ekstrem.
- Latensi dan biaya: Model besar dapat menjadi lambat dan mahal. Terutama jika Anda ingin mengadopsi model dalam skala besar, akan sulit untuk memperkirakan biaya dan penggunaan resource model di awal. Untuk mengurangi dampak, gunakan caching, batching, dan model yang lebih kecil untuk tugas singkat.
Kesimpulan Anda
Singkatnya, AI generatif mengubah ide mentah menjadi konten nyata seperti teks, gambar, kode, atau percakapan. Alat ini sangat berguna jika kreativitas dan kemampuan beradaptasi lebih penting daripada presisi.
Sebagai developer web, kesuksesan Anda bergantung pada perancangan perintah yang tepat, meng-grounding model Anda pada data yang tepat, dan terus menyelaraskan sistem dengan preferensi pengguna.
Resource
Baca tentang memilih model yang lebih kecil dan berkelanjutan. Untuk pembelajaran yang lebih lanjut:
- Ikuti Kursus Singkat Machine Learning tentang AI Generatif.
- Tinjau Toolkit AI Generatif yang Bertanggung Jawab.
- Untuk mempelajari lebih lanjut berbagai jenis model dasar dalam AI generatif, baca bab 5 dalam The Art of AI Product Development.
Uji pemahaman Anda
Apa perbedaan utama antara output AI generatif dan AI prediktif?
Apa peran suhu model?
Mengapa tolok ukur standar sering kali tidak cukup untuk mengevaluasi AI generatif?
Manakah berikut ini yang merupakan mitigasi umum untuk halusinasi?
Apa yang harus Anda lakukan dengan masukan pengguna, menurut loop AI generatif?