ในขณะที่ AI เชิงคาดการณ์ดึงข้อมูลเชิงลึกจากข้อมูลที่มีอยู่ Generative AI จะก้าวไปอีกขั้นและสร้างสิ่งใหม่ๆ โดยสามารถเขียนข้อความ สร้างรูปภาพ สร้างโค้ด หรือแม้แต่ออกแบบอินเทอร์เฟซผู้ใช้ทั้งหมด ตัวอย่างกรณีการใช้งาน Generative AI ที่พบบ่อยมีดังนี้
- การสร้างเนื้อหา: ผู้ช่วยในการเขียน AI สามารถสร้างฉบับร่างและปรับแต่งข้อความที่มีอยู่
- การสรุป: เครื่องมืออย่างข้อมูลภาพรวมโดย AI ของ Google จะย่อเอกสาร การประชุม หรือหน้าเว็บที่ยาวให้เป็นข้อมูลสรุปที่กระชับและนำไปใช้ได้จริง
- การสร้างโค้ด: เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ใช้ Generative AI เพื่อเขียนและปรับโครงสร้างโค้ดใหม่ ซึ่งจะช่วยเพิ่มประสิทธิภาพการทำงานของนักพัฒนาซอฟต์แวร์
- การสร้างรูปภาพและชิ้นงาน: ผู้ใช้สามารถสร้างชิ้นงานภาพ เช่น แบนเนอร์และภาพปก โดยใช้โมเดลการมองเห็น
วงจรของ Generative AI
โมเดล Generative AI ส่วนใหญ่ได้รับการฝึกโดยใช้โครงข่ายประสาทเทียม และสถาปัตยกรรม Transformer โมเดลจะเรียนรู้ที่จะแนะนำองค์ประกอบถัดไปในลำดับ เช่น คำ พิกเซล หรือโน้ตถัดไป โดยอิงตามองค์ประกอบก่อนหน้า
ในทางคณิตศาสตร์แล้ว การทำงานนี้ไม่ได้แตกต่างจาก AI เชิงคาดการณ์มากนัก ทั้ง 2 อย่างนี้เรียนรู้รูปแบบจากข้อมูล ความแตกต่างอยู่ที่ขนาด
ใน AI เชิงคาดการณ์ ตัวเลือกเอาต์พุตจะจำกัดไว้ที่ป้ายกำกับ 2-3 รายการ เช่น "การเลิกใช้งาน" หรือ "ไม่มีการเลิกใช้งาน" ใน Generative AI พื้นที่เอาต์พุตอาจมีตัวเลือกหลายแสนรายการ กลไกการคาดการณ์ได้รับการฝึกฝนจากตัวอย่างนับพันล้านรายการจนพัฒนาเป็นเครื่องมืออันทรงพลังที่สามารถสร้างเอาต์พุตใหม่ๆ ที่ไม่เคยเห็นมาก่อน
การพัฒนาระบบ Generative AI เป็นไปตามแนวทางแบบวนซ้ำ
เราจะอธิบายวิธีการทำงานของฟีเจอร์นี้โดยใช้แอปพลิเคชันตัวอย่าง BlogBuddy ซึ่งเป็น ผู้ช่วยระบบจัดการเนื้อหาที่ช่วยให้ผู้ใช้สร้างคำอธิบายที่น่าสนใจ และชื่อบทความที่เหมาะกับ SEO
กำหนดกรณีการใช้งาน
คำชี้แจงปัญหาควรมีข้อมูลต่อไปนี้
- รูปแบบอินพุตและเอาต์พุต ซึ่งอาจเป็นข้อความ (ร้อยแก้วหรือโค้ด) รูปภาพ หรือเสียง
- วิธีการป้อนข้อมูล เนื้อหามาจากช่องอัปโหลด ข้อความอิสระ หรืออินพุตโครงสร้างอื่นๆ ใช่ไหม
- กลุ่มเป้าหมาย ผู้ที่ดำเนินงานนี้คือใคร ผู้ใช้มีความรู้ทั่วไป หรือต้องการความรู้เฉพาะทาง
ฟีเจอร์ของ BlogBuddy มุ่งเน้นไปที่การสร้างข้อความ อินพุตเป็นแบบ กึ่งมีโครงสร้าง: ผู้ใช้ระบุหัวข้อหรือฉบับร่างสั้นๆ แล้วโมเดลจะแสดง รูปแบบต่างๆ กลุ่มเป้าหมายคือการตลาดที่มีความรู้เฉพาะทางด้านบรรณาธิการ
คุณควรตั้งค่ามาตรฐานคุณภาพสำหรับเอาต์พุต ในกรณีของเรา เราต้องการสร้างข้อความสั้นๆ ที่สแกนได้และมีคีย์เวิร์ดจำนวนมากซึ่งเหมาะกับโทนของสิ่งพิมพ์
เมตริกวัดความสำเร็จที่ชัดเจนจะช่วยให้คุณนำทางกระบวนการที่เหลือได้ คุณจะ ดูข้อมูลเพิ่มเติมเกี่ยวกับการรวบรวมเมตริกความสําเร็จได้ใน การพัฒนาที่ขับเคลื่อนด้วยการประเมิน
เลือกโมเดลพื้นฐาน
มีโมเดลมากมายที่พร้อมใช้งานซึ่งได้รับการฝึกล่วงหน้าจากชุดข้อมูลขนาดใหญ่และครอบคลุม และปรับเปลี่ยนลักษณะการทำงานให้เหมาะกับความต้องการเฉพาะได้ โดยปกติแล้ว โมเดล Generative AI จะมีขนาดใหญ่และซับซ้อนกว่าโมเดลเชิงคาดการณ์มาก ดังนั้นจึงควรสร้างต่อยอดจากโมเดลที่มีอยู่แทนที่จะสร้างและฝึกโมเดลของคุณเอง
ตัวเลือกของคุณจะเป็นตัวกำหนดความสามารถ ต้นทุน การปรับแต่ง และขอบเขตความเป็นส่วนตัวของผลิตภัณฑ์ การเลือกรุ่นมีความเชื่อมโยงอย่างมากกับแพลตฟอร์มที่คุณใช้ระบบ AI
ในส่วนหลังของหลักสูตรนี้ คุณจะได้เรียนรู้วิธีเลือกแพลตฟอร์ม
วิศวกรรมพรอมต์และบริบท
เมื่อเลือกรุ่นแล้ว คุณต้องป้อนคำสั่งที่ถูกต้องพร้อมพรอมต์ สำหรับ BlogBuddy เราอาจป้อนพรอมต์โมเดลดังนี้
Generate three short, engaging title suggestions for this article
คุณเพิ่มข้อมูลได้หลายประเภทลงในพรอมต์ เช่น
- พรอมต์ของระบบที่กำหนดลักษณะการทำงานทั่วไป
- บริบทเฉพาะอินพุตสำหรับงานปัจจุบัน
- คำสั่งสำหรับผู้ใช้ในแอปพลิเคชันแบบสนทนา เช่น แชทบอทหรือเอเจนต์
การอนุมานและการประมวลผลภายหลัง
เมื่อประกอบพรอมต์แล้ว ระบบจะส่งไปยังโมเดลเพื่อทำการอนุมาน คุณสามารถเปลี่ยนพารามิเตอร์ของโมเดล ซึ่งรวมถึงอุณหภูมิ (เพื่อความสร้างสรรค์) และจำนวนโทเค็นสูงสุด (เพื่อความยาวและความละเอียด) เพื่อปรับวิธีที่โมเดลตอบ หลังจากสร้างแล้ว มักจะมีการประมวลผลเอาต์พุตด้วยกฎและขอบเขตเพิ่มเติม
เช่น คุณอาจปรับข้อความที่ระบุเพศ กลั่นกรองน้ำเสียง หรือกรองคำที่ถูกแบนออก
คุณสามารถเพิ่มโมเดลรองขนาดเล็กเพื่อจัดประเภทหรือสรุปผลลัพธ์เพื่อรองรับความโปร่งใสและการปรับเทียบความน่าเชื่อถือ เช่น "คำนำที่สร้างจากบทความที่เกี่ยวข้อง 12 รายการ ความมั่นใจ: สูง"
วงจรการประเมินและฟีดแบ็ก
เนื่องจากพื้นที่เอาต์พุตสำหรับ Generative AI นั้นแทบจะไม่มีที่สิ้นสุด พรอมต์ส่วนใหญ่จึงไม่มีคำตอบที่ถูกต้องเพียงคำตอบเดียว การเปรียบเทียบมาตรฐาน เช่น MMLU หรือ SQuAD สามารถวัดความสามารถทั่วไปของโมเดลได้ แต่แทบจะไม่ตอบโจทย์ความต้องการเฉพาะ ของผู้ใช้ที่เป็นมนุษย์ ในบริบทของผลิตภัณฑ์ คุณต้องกำหนดส่วนผสมของเมตริกเชิงคุณภาพและเชิงปริมาณด้วยตนเอง ดังนี้
- ความถูกต้อง: เอาต์พุตถูกต้องตามข้อเท็จจริงไหม
- ประโยชน์: เอาต์พุตเป็นไปตามความคาดหวังที่พรอมต์กำหนดหรือเจตนาของผู้ใช้หรือไม่
- ความสามารถในการอ่านและโทน: ผลลัพธ์ชัดเจนและสอดคล้องกับมาตรฐานแบรนด์หรือไม่
- ความพยายามของมนุษย์: ต้องมีการแก้ไขหรือดูแลจัดการด้วยตนเองมากเพียงใด
- ความเข้าใจโดเมน: เอาต์พุตแสดงความรู้เฉพาะโดเมนหรือไม่
หากต้องการประเมินเมตริกเหล่านี้ คุณสามารถใช้การตรวจสอบจากเจ้าหน้าที่และการให้คะแนนอัตโนมัติร่วมกันได้ เช่น คุณสามารถขอให้ผู้ใช้ให้คะแนนเอาต์พุตในชีวิตจริง ใช้โมเดลที่ 2 สำหรับ การประเมินอัตโนมัติ (เรียกอีกอย่างว่า LLM-as-a-judge) และทำการตรวจสอบภายในเป็นระยะๆ เพื่อหาอคติหรืออาการหลอน
ข้อมูลการใช้งานจริงเป็นหนึ่งในทรัพย์สินที่มีค่าที่สุดเมื่อสร้างด้วย Generative AI หากเป็นไปได้ ให้บันทึกการโต้ตอบเหล่านี้เพื่อปรับแต่งพรอมต์และบริบท ทดสอบโมเดลต่างๆ หรือปรับพารามิเตอร์เมื่อเวลาผ่านไป การโต้ตอบ การแก้ไข หรือการให้คะแนนของผู้ใช้แต่ละครั้งจะกลายเป็นความคิดเห็นที่ช่วยคุณกำหนดขั้นตอนการเพิ่มประสิทธิภาพครั้งถัดไปได้
- อินพุตของผู้ใช้ที่ไม่คาดคิดจะช่วยให้คุณทราบว่ากำลังแก้ปัญหาที่ถูกต้องหรือไม่
- คำขอที่เกิดขึ้นซ้ำๆ สำหรับโดเมนที่เฉพาะเจาะจงจะช่วยให้ทราบถึงตัวเลือกโมเดล คุณอาจเปลี่ยน จาก LLM ขนาดใหญ่ทั่วไปเป็นโมเดลขนาดเล็กที่ปรับแต่งมาอย่างละเอียด
- การหลอนบ่อยๆ อาจบ่งบอกถึงการขาดบริบทที่เฉพาะเจาะจงในพรอมต์ของคุณ
- การแก้ไขอย่างหนักอาจบ่งบอกถึงบริบทที่แชร์ไม่เพียงพอ โมเดลไม่ทราบข้อมูลที่ผู้ใช้ถือว่าทราบอยู่แล้ว
เมื่อเวลาผ่านไป วงจรความคิดเห็นเหล่านี้จะเปลี่ยนฟีเจอร์ Generative AI จากการเรียกโมเดลแบบคงที่ให้กลายเป็นระบบที่มีชีวิตซึ่งปรับให้เข้ากับความต้องการและความชอบของผู้ใช้ได้อย่างต่อเนื่อง
ข้อผิดพลาดที่พบบ่อยและการลดความเสี่ยง
เนื่องจาก Generative AI ทำงานในพื้นที่เปิดของอินพุตและเอาต์พุต พื้นผิวความเสี่ยงจึงกว้างกว่าในระบบการคาดการณ์มาก นอกจากจะสร้างเอาต์พุตที่ไม่ถูกต้องแล้ว ยังอาจสร้างเนื้อหาที่เป็นพิษ มีอคติ หรือทำให้เข้าใจผิด หรือแม้แต่ โน้มน้าวผู้ใช้โดยไม่ตั้งใจได้ด้วย ความล้มเหลวเหล่านี้อาจทำให้ความน่าเชื่อถือลดลงและทำให้บริษัทของคุณ ต้องเผชิญกับผลกระทบทางการเงินหรือทางกฎหมาย
ด้วยเหตุนี้ Generative AI จึงต้องใช้แนวทางการจัดการความเสี่ยงเชิงรุกอย่างต่อเนื่อง ความเสี่ยงที่พบบ่อยที่สุดมีดังนี้
- อาการหลอนของ AI: โมเดลแต่งข้อเท็จจริงขึ้นมาหรือระบุรายละเอียดผิด หากต้องการ ลดผลกระทบ ให้ใช้ RAG เพื่ออ้างอิงข้อเท็จจริง
- เชื่อมั่นมากเกินไป: ผู้ใช้คิดว่าเอาต์พุตถูกต้องเสมอ เพื่อลดความเสี่ยง แนะนําให้ใช้ขั้นตอนการตรวจสอบและแก้ไขแทนการเผยแพร่โดยอัตโนมัติ ใน การกำกับดูแล AI: การสร้างอย่างมีความรับผิดชอบ คุณจะ ได้เรียนรู้วิธีช่วยผู้ใช้ปรับระดับความไว้วางใจ
- ความไม่สอดคล้องกัน: เอาต์พุตจะแตกต่างกันอย่างมากในแต่ละครั้งที่รัน หากต้องการลดปัญหา ให้ใช้เทมเพลตพรอมต์ การควบคุมอุณหภูมิ หรือตัวอย่างแบบไม่กี่ช็อตเพื่อรักษาโทนและ โครงสร้าง
- เนื้อหาที่เป็นพิษหรือเป็นอันตราย: โมเดลสร้างข้อความที่ลำเอียง ไม่เหมาะสม หรือ เป็นการบิดเบือน หากต้องการลดความเสี่ยง ให้ใช้ตัวกรองการกลั่นกรองและเครื่องมือแยกประเภทความเป็นพิษก่อนแสดง ทดสอบเอาต์พุตอย่างต่อเนื่องด้วยพรอมต์จริงและสร้างวงจรความคิดเห็นเพื่อแจ้ง และฝึกซ้ำในกรณีที่ซับซ้อน
- เวลาในการตอบสนองและต้นทุน: โมเดลขนาดใหญ่อาจทำงานช้าและมีค่าใช้จ่ายสูง โดยเฉพาะอย่างยิ่งหากคุณตั้งเป้าที่จะนำไปใช้ในวงกว้าง การประมาณต้นทุน และการใช้ทรัพยากรของโมเดลล่วงหน้าอาจเป็นเรื่องยาก หากต้องการลดปัญหา ให้ใช้การแคช การประมวลผลแบบกลุ่ม และโมเดลขนาดเล็กสำหรับงานสั้นๆ
สิ่งที่ได้เรียนรู้
กล่าวโดยย่อคือ Generative AI จะเปลี่ยนไอเดียดิบๆ ให้กลายเป็นเนื้อหาที่จับต้องได้ เช่น ข้อความ รูปภาพ โค้ด หรือการสนทนา โดยจะทำงานได้ดีในกรณีที่ความคิดสร้างสรรค์และความสามารถในการปรับตัว มีความสำคัญมากกว่าความแม่นยำ
ในฐานะนักพัฒนาเว็บ ความสำเร็จของคุณขึ้นอยู่กับการออกแบบพรอมต์ที่เหมาะสม การอิงโมเดลกับข้อมูลที่ถูกต้อง และการปรับระบบให้สอดคล้องกับค่ากำหนดของผู้ใช้อย่างต่อเนื่อง
แหล่งข้อมูล
อ่านเกี่ยวกับการเลือกโมเดลขนาดเล็กและยั่งยืน หากต้องการเรียนรู้เพิ่มเติม
- เข้าร่วมหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิงใน Generative AI
- อ่านชุดเครื่องมือ Generative AI อย่างมีความรับผิดชอบ
- ดูข้อมูลเพิ่มเติมเกี่ยวกับโมเดลพื้นฐานประเภทต่างๆ ใน Generative AI ได้ที่บทที่ 5 ในศิลปะการพัฒนาผลิตภัณฑ์ AI
ทดสอบความเข้าใจ
ผลลัพธ์ของ Generative AI กับ Predictive AI แตกต่างกันอย่างไร
อุณหภูมิของโมเดลมีบทบาทอย่างไร
เหตุใดเกณฑ์มาตรฐานที่ได้มาตรฐานจึงมักไม่เพียงพอต่อการประเมิน Generative AI
ข้อใดต่อไปนี้คือการลดปัญหาการหลอนที่พบบ่อย
คุณควรทำอย่างไรกับความคิดเห็นของผู้ใช้ตามวงจร Generative AI