เลือกแพลตฟอร์มของคุณ

ก่อนที่จะสร้างด้วย AI คุณต้องเลือกแพลตฟอร์มที่จะโฮสต์ ตัวเลือกของคุณส่งผลต่อความเร็ว ต้นทุน ความสามารถในการปรับขนาด และความน่าเชื่อถือของระบบ AI คุณสามารถเลือกได้ระหว่าง:

  • AI ฝั่งไคลเอ็นต์: ทำงานในเบราว์เซอร์โดยตรง ซึ่งหมายความว่าข้อมูลจะยังคงเป็นส่วนตัวอยู่ในอุปกรณ์ของผู้ใช้ และไม่มีเวลาในการตอบสนองของเครือข่าย อย่างไรก็ตาม AI ฝั่งไคลเอ็นต์ต้องมี Use Case ที่เฉพาะเจาะจงและกำหนดไว้อย่างดีจึงจะทำงานได้ดี
  • AI ฝั่งเซิร์ฟเวอร์: ทำงานในระบบคลาวด์ มีความสามารถสูงและปรับขนาดได้ แต่ มีราคาแพงกว่าในแง่ของเวลาในการตอบสนองและค่าใช้จ่าย

แต่ละตัวเลือกมีข้อดีและข้อเสียต่างกัน และการตั้งค่าที่เหมาะสมจะขึ้นอยู่กับกรณีการใช้งาน ทักษะของทีม และทรัพยากร เช่น คุณอาจเสนอเครื่องมือสรุปที่ทำงานในเครื่องเพื่อให้ผู้ใช้ถามคำถามส่วนตัวได้โดยไม่ต้องจัดการข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII) อย่างไรก็ตาม เจ้าหน้าที่ฝ่ายสนับสนุนลูกค้าอาจให้คำตอบที่เป็นประโยชน์มากขึ้นได้โดยใช้โมเดลบนระบบคลาวด์ที่มีสิทธิ์เข้าถึงฐานข้อมูลขนาดใหญ่ของแหล่งข้อมูล

ในโมดูลนี้ คุณจะได้ศึกษาวิธีทำสิ่งต่อไปนี้

  • เปรียบเทียบข้อดีข้อเสียระหว่าง AI ฝั่งไคลเอ็นต์และฝั่งเซิร์ฟเวอร์
  • เลือกแพลตฟอร์มให้ตรงกับกรณีการใช้งานและความสามารถของทีม
  • ออกแบบระบบไฮบริดที่มี AI ทั้งในไคลเอ็นต์และเซิร์ฟเวอร์เพื่อให้เติบโตไปพร้อมกับผลิตภัณฑ์ของคุณ

ตรวจสอบตัวเลือก

สำหรับการติดตั้งใช้งาน ให้พิจารณาแพลตฟอร์ม AI ตามแกนหลัก 2 แกน โดยมีตัวเลือกดังต่อไปนี้

  • ตำแหน่งที่โมเดลทํางาน: โมเดลทํางานฝั่งไคลเอ็นต์หรือฝั่งเซิร์ฟเวอร์
  • ความสามารถในการปรับแต่ง: คุณสามารถควบคุมความรู้และความสามารถของโมเดลได้มากน้อยเพียงใด หากควบคุมโมเดลได้ ซึ่งหมายความว่าคุณสามารถแก้ไขน้ำหนักของโมเดลได้ คุณจะปรับแต่งลักษณะการทำงานของโมเดลให้ตรงกับข้อกำหนดเฉพาะได้
ตัวอย่างโมเดลตามแพลตฟอร์มและการควบคุม
รูปที่ 1: ตัวเลือกแพลตฟอร์ม AI ที่จำแนกตามแพลตฟอร์มการ ติดตั้งใช้งานและระดับการควบคุม

AI ฝั่งไคลเอ็นต์

AI ฝั่งไคลเอ็นต์จะทำงานในเบราว์เซอร์ และการคำนวณจะเกิดขึ้นในอุปกรณ์ของผู้ใช้ คุณไม่จำเป็นต้องจัดสรรการประมวลผลในช่วงเวลาอนุมาน และข้อมูลจะยังคงอยู่ในเครื่องของผู้ใช้ ซึ่งทำให้ WebAssembly ทำงานได้รวดเร็ว เป็นส่วนตัว และเหมาะสำหรับประสบการณ์การใช้งานแบบอินเทอร์แอกทีฟที่ใช้ทรัพยากรน้อย

อย่างไรก็ตาม โมเดลฝั่งไคลเอ็นต์มักมีขนาดเล็กมาก ซึ่งอาจจำกัดความสามารถและประสิทธิภาพของโมเดล เหมาะสำหรับงานที่มีความเฉพาะเจาะจงสูง เช่น การตรวจหาความเป็นพิษหรือการวิเคราะห์ความรู้สึก โดยมักจะเป็นงาน AI แบบคาดการณ์ที่มีพื้นที่เอาต์พุตจำกัด

คุณมี 2 ตัวเลือกหลักๆ ดังนี้

  • AI ในตัว: เบราว์เซอร์ เช่น Google Chrome และ Microsoft Edge กำลังผสานรวมโมเดล AI โดยสามารถเข้าถึงได้ผ่านการเรียกใช้ JavaScript โดยไม่ต้องตั้งค่าหรือโฮสต์ เมื่อดาวน์โหลดโมเดลแล้ว ทุกเว็บไซต์ที่ใช้โมเดลดังกล่าวจะเรียกใช้ได้
  • โมเดลที่กำหนดเอง: คุณสามารถใช้ไลบรารีฝั่งไคลเอ็นต์ เช่น Transformers.js และ MediaPipe เพื่อ ผสานรวมโมเดลเข้ากับแอปพลิเคชัน ซึ่งหมายความว่าคุณสามารถควบคุมน้ำหนักของโมเดลได้ แต่ก็หมายความว่าผู้ใช้เว็บไซต์ทุกคนต้องดาวน์โหลดโมเดลที่กำหนดเอง แม้แต่โมเดล AI ที่เล็กที่สุดก็มีขนาดใหญ่ในบริบทของเว็บไซต์

AI ฝั่งเซิร์ฟเวอร์

เมื่อใช้ AI ฝั่งเซิร์ฟเวอร์ เว็บแอปพลิเคชันจะเรียก API เพื่อส่งอินพุตไปยังโมเดล AI และรับเอาต์พุต การตั้งค่านี้รองรับโมเดลที่ใหญ่ขึ้นและซับซ้อนมากขึ้น และไม่ขึ้นอยู่กับฮาร์ดแวร์ของผู้ใช้

AI ฝั่งเซิร์ฟเวอร์มี 2 หมวดหมู่ ดังนี้

  • บริการที่มีการจัดการ: โมเดลเหล่านี้โฮสต์อยู่ในศูนย์ข้อมูลโดยบุคคลที่สาม เช่น Gemini 3 และ GPT-5 เจ้าของโมเดลจะให้ API เพื่อเข้าถึงโมเดล ซึ่งหมายความว่าคุณสามารถใช้โมเดลที่ล้ำสมัยที่สุดได้โดยมีการตั้งค่าเพียงเล็กน้อย โมเดลเหล่านี้เหมาะสำหรับ การสร้างต้นแบบอย่างรวดเร็ว การสนทนาแบบปลายเปิด และการให้เหตุผลแบบอเนกประสงค์ อย่างไรก็ตาม การปรับขนาดในบริการที่มีการจัดการอาจมีค่าใช้จ่ายสูง
  • โมเดลที่โฮสต์ด้วยตนเอง: คุณสามารถติดตั้งใช้งานโมเดลแบบโอเพนเวท เช่น Gemma หรือ Llama ในโครงสร้างพื้นฐานของคุณเอง หรือในคอนเทนเนอร์ที่มีการจัดการ เช่น Vertex AI หรือ Hugging Face Inference ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากการฝึกเบื้องต้นที่ผู้สร้างโมเดลทำไว้ แต่คุณยังคงควบคุมโมเดล ข้อมูลการปรับแต่ง และประสิทธิภาพได้

เลือกแพลตฟอร์มเริ่มต้น

ตรวจสอบลักษณะทางสถาปัตยกรรมของแพลตฟอร์ม AI และวิเคราะห์ ข้อดีข้อเสียเพื่อตัดสินใจเกี่ยวกับการตั้งค่าเริ่มต้น

กำหนดข้อกำหนดด้านสถาปัตยกรรม

ทุกการตัดสินใจต้องมีการประนีประนอม ดูคุณลักษณะสำคัญที่กำหนดต้นทุนและมูลค่าของแพลตฟอร์ม AI

  • ความสามารถของโมเดล: ประสิทธิภาพของโมเดลในกลุ่มผู้ใช้และ งานที่หลากหลายโดยไม่ต้องปรับแต่ง ซึ่งมักจะสัมพันธ์กับขนาดโมเดล
  • ความสามารถในการปรับแต่ง: ระดับที่คุณสามารถปรับแต่ง แก้ไข หรือควบคุม ลักษณะการทำงานและสถาปัตยกรรมของโมเดล
  • ความแม่นยำ: คุณภาพและความน่าเชื่อถือโดยรวมของการคาดการณ์ หรือการสร้างของโมเดล
  • ความเป็นส่วนตัว: ระดับที่ข้อมูลผู้ใช้ยังคงอยู่ในเครื่องและอยู่ภายใต้การควบคุมของผู้ใช้
  • ต้นทุนคงที่: ค่าใช้จ่ายที่เกิดซ้ำซึ่งจำเป็นต่อการใช้งานระบบ AI โดยไม่คำนึงถึงการใช้งาน รวมถึงการจัดสรรและการบำรุงรักษาโครงสร้างพื้นฐาน
  • ต้นทุนต่อคำขอ: ต้นทุนเพิ่มเติมของคำขอขาเข้าแต่ละรายการ
  • ความเข้ากันได้: วิธีการทำงานของแนวทางในเบราว์เซอร์ อุปกรณ์ และสภาพแวดล้อมต่างๆ โดยไม่มีตรรกะสำรอง
  • ความสะดวกของผู้ใช้: ผู้ใช้ต้องทำตามขั้นตอนเพิ่มเติมเพื่อใช้ระบบ AI หรือไม่ เช่น การดาวน์โหลดโมเดล
  • ความสะดวกของนักพัฒนาแอป: ความรวดเร็วและง่ายดายในการ ติดตั้งใช้งาน ผสานรวม และบำรุงรักษาโมเดลสำหรับนักพัฒนาแอปส่วนใหญ่ โดยไม่ต้องมีความเชี่ยวชาญด้าน AI โดยเฉพาะ

ตารางต่อไปนี้แสดงตัวอย่างค่าประมาณของประสิทธิภาพของแต่ละแพลตฟอร์ม สำหรับแต่ละเกณฑ์ โดย 1 คือต่ำสุด และ 5 คือสูงสุด

เกณฑ์ ไคลเอ็นต์ เซิร์ฟเวอร์
AI ในตัวหรือในอุปกรณ์ โมเดลที่กำหนดเอง บริการที่มีการจัดการ รูปแบบการโฮสต์ด้วยตนเอง
พลังของโมเดล

ทำไมถึงให้คะแนนพลังของโมเดล 2 ดาว

AI ในตัวและในอุปกรณ์ใช้โมเดลเบราว์เซอร์ขนาดเล็กที่โหลดไว้ล่วงหน้าซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับฟีเจอร์เฉพาะงานที่จำกัด แทนที่จะเป็นการสนทนาหรือการให้เหตุผลแบบเปิด

ทำไมถึงให้คะแนนความสามารถของโมเดล 3 ดาว

ไลบรารีฝั่งไคลเอ็นต์ที่กำหนดเองมีความยืดหยุ่นมากกว่า AI ในตัว แต่คุณยังคงถูกจำกัดด้วยขนาดการดาวน์โหลด ขีดจำกัดของหน่วยความจำ และฮาร์ดแวร์ของผู้ใช้

ทำไมจึงให้คะแนนพลังของโมเดล 4 ดาว

บริการที่มีการจัดการและการโฮสต์ด้วยตนเองช่วยให้คุณเข้าถึงโมเดลขนาดใหญ่ที่ทันสมัย ซึ่งมีความสามารถในการให้เหตุผลที่ซับซ้อน การจัดการบริบทที่ยาว และครอบคลุมงานในวงกว้าง

ความสามารถในการปรับแต่ง

เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่ง

โมเดลในตัวไม่อนุญาตให้เข้าถึงน้ำหนักของโมเดลหรือข้อมูลการฝึก วิธีหลักในการปรับแต่งลักษณะการทำงานของโมเดลคือการใช้พรอมต์วิศวกรรม

เหตุใดจึงให้ 5 ดาวสำหรับการปรับแต่ง

ตัวเลือกนี้ช่วยให้คุณควบคุมการเลือกโมเดลและน้ำหนักได้ ไลบรารีฝั่งไคลเอ็นต์หลายรายการยังอนุญาตให้ปรับแต่งและฝึกโมเดลด้วย

เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่ง

บริการที่มีการจัดการจะแสดงโมเดลที่มีประสิทธิภาพ แต่ให้การควบคุมพฤติกรรมภายในของโมเดลน้อยที่สุด โดยปกติแล้ว การปรับแต่งจะจำกัดอยู่แค่การแจ้งและบริบทอินพุต

เหตุใดจึงให้ 5 ดาวสำหรับความสามารถในการปรับแต่ง

โมเดลที่โฮสต์ด้วยตนเองช่วยให้คุณควบคุมน้ำหนักของโมเดล ข้อมูลการฝึก การปรับแต่ง และการกำหนดค่าการติดตั้งใช้งานได้อย่างเต็มที่

ความแม่นยำ

เหตุใดจึงให้คะแนนความถูกต้อง 2 ดาว

ความแม่นยำในโมเดลในตัวเพียงพอสำหรับงานที่มีขอบเขตชัดเจน แต่ขนาดโมเดลที่จำกัดและการสรุปทั่วไปจะลดความน่าเชื่อถือสำหรับอินพุตที่ซับซ้อนหรือมีความแตกต่างเล็กน้อย

เหตุใดจึงให้คะแนนความถูกต้อง 3 ดาว

คุณสามารถปรับปรุงความแม่นยำของโมเดลฝั่งไคลเอ็นต์ที่กำหนดเองได้ในกระบวนการเลือกโมเดล อย่างไรก็ตาม ยังคงมีข้อจำกัดด้านขนาดโมเดล การหาปริมาณ และความแปรปรวนของฮาร์ดแวร์ไคลเอ็นต์

เหตุใดจึงต้องให้คะแนนความถูกต้อง 5 ดาว

โดยปกติแล้ว บริการที่มีการจัดการจะมีความแม่นยำค่อนข้างสูง ซึ่งเป็นผลมาจากโมเดลขนาดใหญ่ ข้อมูลการฝึกที่ครอบคลุม และการปรับปรุงอย่างต่อเนื่องของผู้ให้บริการ

เหตุใดจึงให้คะแนนความถูกต้อง 4 ดาว

ความแม่นยำอาจสูง แต่ขึ้นอยู่กับโมเดลที่เลือกและความพยายามในการปรับแต่ง ประสิทธิภาพอาจช้ากว่าบริการที่มีการจัดการ

เวลาในการตอบสนองของเครือข่าย

ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 5 ดาว

การประมวลผลเกิดขึ้นในอุปกรณ์ของผู้ใช้โดยตรง

ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 2 ดาว

มีการรับส่งข้อมูลแบบไปกลับไปยังเซิร์ฟเวอร์

ความเป็นส่วนตัว

เหตุใดจึงให้คะแนนความเป็นส่วนตัว 5 ดาว

ข้อมูลผู้ใช้ควรอยู่ในอุปกรณ์โดยค่าเริ่มต้น ซึ่งจะช่วยลดการเปิดเผยข้อมูลและลดความซับซ้อนในการปฏิบัติตามข้อกำหนดด้านความเป็นส่วนตัว

เหตุใดจึงให้คะแนนความเป็นส่วนตัว 2 ดาว

ต้องส่งข้อมูลที่ผู้ใช้ป้อนไปยังเซิร์ฟเวอร์ภายนอก ซึ่งจะเพิ่มการเปิดเผยข้อมูลและข้อกำหนดด้านการปฏิบัติตามข้อกำหนด อย่างไรก็ตาม มีโซลูชันเฉพาะเพื่อลดปัญหาด้านความเป็นส่วนตัว เช่น Private AI Compute

เหตุใดจึงให้คะแนนความเป็นส่วนตัว 3 ดาว

ข้อมูลจะยังอยู่ภายใต้การควบคุมขององค์กร แต่จะออกจากอุปกรณ์ของผู้ใช้และต้องมีการจัดการที่ปลอดภัยและมาตรการการปฏิบัติตามข้อกำหนด

ค่าธรรมเนียมคงที่

เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่

โมเดลจะทำงานในอุปกรณ์ที่มีอยู่ของผู้ใช้ จึงไม่มีค่าใช้จ่ายด้านโครงสร้างพื้นฐานเพิ่มเติม

เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่

API ส่วนใหญ่จะเรียกเก็บเงินตามการใช้งาน จึงไม่มีต้นทุนคงที่

เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนคงที่

ต้นทุนคงที่รวมถึงโครงสร้างพื้นฐาน การบำรุงรักษา และค่าใช้จ่ายในการดำเนินงาน

ต้นทุนต่อคำขอ

เหตุใดจึงให้คะแนน 5 ดาวสำหรับต้นทุนต่อคำขอ

ไม่มีค่าใช้จ่ายต่อคำขอเนื่องจากระบบจะเรียกใช้การอนุมานในอุปกรณ์ของผู้ใช้

เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนต่อคำขอ

บริการที่มีการจัดการมักจะมีราคาต่อคำขอ ค่าใช้จ่ายในการปรับขนาดอาจเพิ่มขึ้นอย่างมาก โดยเฉพาะเมื่อมีการเข้าชมสูง

เหตุใดจึงให้ 3 ดาวสำหรับต้นทุนต่อคำขอ

ไม่มีค่าใช้จ่ายต่อคำขอโดยตรง แต่ค่าใช้จ่ายต่อคำขอที่มีประสิทธิภาพจะขึ้นอยู่กับการใช้โครงสร้างพื้นฐาน

ความเข้ากันได้

เหตุใดจึงให้คะแนนความเข้ากันได้ 2 ดาว

ความพร้อมใช้งานจะแตกต่างกันไปตามเบราว์เซอร์และอุปกรณ์ ซึ่งต้องมีการสำรองข้อมูลสำหรับสภาพแวดล้อมที่ไม่รองรับ

ทำไมจึงให้คะแนนความเข้ากันได้ 1 ดาว

ความเข้ากันได้ขึ้นอยู่กับความสามารถของฮาร์ดแวร์และการรองรับรันไทม์ ซึ่งจำกัดการเข้าถึงในอุปกรณ์ต่างๆ

เหตุใดจึงให้คะแนนความเข้ากันได้ 5 ดาว

แพลตฟอร์มฝั่งเซิร์ฟเวอร์เข้ากันได้กับผู้ใช้ทุกรายในวงกว้าง เนื่องจากมีการอนุมานฝั่งเซิร์ฟเวอร์และไคลเอ็นต์ใช้เพียง API

ความสะดวกของผู้ใช้

เหตุใดจึงให้ 3 ดาวสำหรับความสะดวกของผู้ใช้

โดยทั่วไปแล้วฟีเจอร์นี้จะทำงานได้อย่างราบรื่นเมื่อพร้อมใช้งาน แต่ AI ในตัวต้องมีการดาวน์โหลดโมเดลเริ่มต้นและการรองรับเบราว์เซอร์

เหตุใดจึงให้ 2 ดาวสำหรับความสะดวกของผู้ใช้

ผู้ใช้อาจพบความล่าช้าเนื่องจากการดาวน์โหลดหรือฮาร์ดแวร์ที่ไม่รองรับ

เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของผู้ใช้

ใช้งานได้ทันทีโดยไม่ต้องดาวน์โหลดหรือมีข้อกำหนดของอุปกรณ์ จึงมอบประสบการณ์การใช้งานที่ราบรื่นให้แก่ผู้ใช้ อย่างไรก็ตาม อาจเกิดความล่าช้าหากการเชื่อมต่อเครือข่ายไม่ดี

ความสะดวกของนักพัฒนาแอป

เหตุใดจึงให้ 5 ดาวเพื่อความสะดวกของนักพัฒนาแอป

AI ในตัวต้องมีการตั้งค่าเพียงเล็กน้อย ไม่ต้องมีโครงสร้างพื้นฐาน และไม่ต้องมีความเชี่ยวชาญด้าน AI มากนัก จึงผสานรวมและบำรุงรักษาได้ง่าย

เหตุใดจึงให้ 2 ดาวเพื่อความสะดวกของนักพัฒนาแอป

ต้องมีการจัดการโมเดล รันไทม์ การเพิ่มประสิทธิภาพ และความเข้ากันได้ในอุปกรณ์ต่างๆ

เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของนักพัฒนาแอป

บริการที่มีการจัดการช่วยลดความซับซ้อนในการติดตั้งใช้งานและการปรับขนาด อย่างไรก็ตาม คุณยังคงต้องผสานรวม API, จัดการค่าใช้จ่าย และทำวิศวกรรมพรอมต์

เหตุใดจึงให้ 1 ดาวเพื่อความสะดวกของนักพัฒนาแอป

การติดตั้งใช้งานฝั่งเซิร์ฟเวอร์ที่กำหนดเองต้องอาศัยความเชี่ยวชาญอย่างมากในด้านโครงสร้างพื้นฐาน การจัดการโมเดล การตรวจสอบ และการเพิ่มประสิทธิภาพ

ความพยายามในการบำรุงรักษา

เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 4 ดาว

เบราว์เซอร์จะจัดการการอัปเดตและการเพิ่มประสิทธิภาพโมเดล แต่นักพัฒนาแอปต้องปรับตัวให้เข้ากับความพร้อมให้บริการที่เปลี่ยนแปลงไป

เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาว

ต้องมีการอัปเดตโมเดล การปรับแต่งประสิทธิภาพ และความเข้ากันได้อย่างต่อเนื่องเมื่อเบราว์เซอร์และอุปกรณ์มีการพัฒนา

เหตุใดจึงให้ 5 ดาวสำหรับความพยายามในการบำรุงรักษา

ผู้ให้บริการจะเป็นผู้จัดการการบำรุงรักษา

เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาว

ต้องมีการบำรุงรักษาอย่างต่อเนื่อง ซึ่งรวมถึงการอัปเดตโมเดล การจัดการโครงสร้างพื้นฐาน การปรับขนาด และความปลอดภัย

ปัจจัยอื่นๆ ตามสถานการณ์

วิเคราะห์ข้อดีข้อเสีย

เราจะเพิ่มฟีเจอร์อีกอย่างลงใน Example Shoppe ซึ่งเป็นแพลตฟอร์มอีคอมเมิร์ซขนาดกลาง เพื่อแสดงให้เห็นกระบวนการตัดสินใจ คุณสนใจที่จะประหยัดค่าใช้จ่ายในการบริการลูกค้านอกเวลาทำการ จึงตัดสินใจสร้างผู้ช่วยที่ทำงานด้วยระบบ AI เพื่อตอบคำถามของผู้ใช้เกี่ยวกับการสั่งซื้อ การคืนสินค้า และผลิตภัณฑ์

รูปที่ 2 ในโมดูลนี้ เราจะมุ่งเน้นที่เลเยอร์ข้อมูลและเลเยอร์อัจฉริยะของพิมพ์เขียวระบบ AI สำหรับ Example Shoppe เป็นหลัก
คุณสามารถดูพิมพ์เขียวระบบ AI ฉบับเต็ม ซึ่งมีโอกาสและโซลูชัน

วิเคราะห์สถานการณ์โดยใช้ 2 มุมมอง ได้แก่ ข้อกำหนดของกรณีการใช้งานและข้อจำกัดทางธุรกิจ หรือข้อจำกัดของทีม

ข้อกำหนด การวิเคราะห์ เกณฑ์ ผลกระทบ
ความแม่นยำสูงและใช้งานได้หลากหลาย ผู้ใช้ถามคำถามที่ซับซ้อนต่างๆ เกี่ยวกับคำสั่งซื้อ ผลิตภัณฑ์ และการคืนสินค้า ความสามารถและความแม่นยำของโมเดล ต้องใช้โมเดลภาษาขนาดใหญ่ (LLM)
ความเฉพาะเจาะจงของข้อมูล โดยจะต้องตอบคำถามที่เฉพาะเจาะจงเกี่ยวกับข้อมูลบริษัท ผลิตภัณฑ์ และนโยบาย ความสามารถในการปรับแต่ง ต้องมีการนำเข้าข้อมูล เช่น RAG แต่ไม่ต้องมีการปรับแต่งโมเดล
ข้อกำหนดของ Use Case
ข้อกำหนด การวิเคราะห์ เกณฑ์ ผลกระทบ
ฐานผู้ใช้ ผู้ใช้หลายแสนราย ความสามารถในการปรับขนาด ความเข้ากันได้ ต้องมีสถาปัตยกรรมที่รองรับการเข้าชมจำนวนมากและเชื่อถือได้
สิ่งที่ควรโฟกัสหลังเปิดตัว ทีมจะย้ายไปทำโปรเจ็กต์อื่นๆ หลังจากเปิดตัวเวอร์ชัน 1 ความพยายามในการบำรุงรักษา ต้องการโซลูชันที่ต้องมีการบำรุงรักษาอย่างต่อเนื่องน้อยที่สุด
ความเชี่ยวชาญของทีม นักพัฒนาเว็บที่มีความสามารถ แต่มีความเชี่ยวชาญด้าน AI/ML น้อย ความสะดวกของนักพัฒนาแอป โซลูชันต้องติดตั้งใช้งานและผสานรวมได้ง่ายโดยไม่ต้องมีทักษะด้าน AI เฉพาะทาง
ข้อจำกัดทางธุรกิจหรือทีม

เมื่อจัดลําดับความสําคัญของเกณฑ์แล้ว คุณสามารถดูตารางการประมาณการแลกเปลี่ยนเพื่อพิจารณาว่าแพลตฟอร์มใดตรงกับเกณฑ์ที่มีลําดับความสําคัญสูงสุด

เกณฑ์ที่มีลำดับความสำคัญ ผู้ชนะบนแพลตฟอร์ม
พลังของโมเดล ฝั่งเซิร์ฟเวอร์
ความสามารถในการปรับแต่ง ฝั่งเซิร์ฟเวอร์: รูปแบบที่โฮสต์ด้วยตนเอง
ความสะดวกของนักพัฒนาแอป ฝั่งเซิร์ฟเวอร์: บริการที่มีการจัดการ
ความพยายามในการบำรุงรักษา ฝั่งเซิร์ฟเวอร์: บริการที่มีการจัดการ
ความเข้ากันได้และความสามารถในการปรับขนาด ฝั่งเซิร์ฟเวอร์

การวิเคราะห์นี้แสดงให้เห็นอย่างชัดเจนว่าคุณควรใช้ AI ฝั่งเซิร์ฟเวอร์และอาจใช้ บริการที่มีการจัดการ ซึ่งเป็นโมเดลที่หลากหลายสำหรับคำถามที่ซับซ้อนของลูกค้า ซึ่งช่วยลดความพยายามในการบำรุงรักษาและการพัฒนาด้วยการส่งต่อโครงสร้างพื้นฐาน คุณภาพของโมเดล และเวลาทำงานไปยังผู้ให้บริการ

แม้ว่าการปรับแต่งจะจำกัด แต่ก็คุ้มค่าสำหรับทีมพัฒนาเว็บที่มีประสบการณ์ด้านวิศวกรรมโมเดลจำกัด

การตั้งค่าการสร้างที่เพิ่มการดึงข้อมูล (RAG) จะช่วยให้คุณระบุบริบทที่เกี่ยวข้องกับโมเดลในเวลาที่อนุมานได้

AI แบบไฮบริด

ระบบ AI ที่มีประสิทธิภาพมักไม่ได้ทำงานบนแพลตฟอร์มเดียวหรือใช้โมเดลเดียว แต่จะกระจายภาระงาน AI เพื่อเพิ่มประสิทธิภาพการแลกเปลี่ยน

ค้นหาโอกาสสำหรับ AI แบบไฮบริด

เมื่อเปิดตัวแล้ว คุณควรปรับแต่งข้อกำหนดตามข้อมูลและฟีดแบ็กในชีวิตจริง ในตัวอย่างของเรา ซึ่งก็คือ Example Shoppe คุณรอ 2-3 เดือนเพื่อ วิเคราะห์ผลลัพธ์และพบข้อมูลต่อไปนี้

  • คำขอประมาณ 80% เป็นคำขอที่ซ้ำกัน ("คำสั่งซื้อของฉันอยู่ที่ไหน" "ฉันจะ คืนสินค้าได้อย่างไร") การส่งคำขอเหล่านี้ไปยังบริการที่มีการจัดการจะทำให้เกิดค่าใช้จ่ายและค่าใช้จ่ายเพิ่มเติมจำนวนมาก
  • มีเพียง 20% ของคำขอเท่านั้นที่ต้องใช้การให้เหตุผลที่ลึกซึ้งยิ่งขึ้นและการสนทนาแบบปลายเปิด แบบอินเทอร์แอกทีฟ

โมเดลน้ำหนักเบาในเครื่องจะจัดประเภทอินพุตของผู้ใช้และตอบคำค้นหาที่ใช้เป็นประจำ เช่น "นโยบายคืนสินค้าของคุณคืออะไร" คุณสามารถกำหนดเส้นทางคำถามที่ซับซ้อน ไม่ค่อยพบ หรือไม่ชัดเจนไปยังโมเดลฝั่งเซิร์ฟเวอร์ได้

การใช้ AI ทั้งฝั่งเซิร์ฟเวอร์และฝั่งไคลเอ็นต์จะช่วยลดต้นทุนและความ หน่วงเวลา พร้อมทั้งยังคงสิทธิ์เข้าถึงการให้เหตุผลที่มีประสิทธิภาพเมื่อจำเป็น

กระจายภาระงาน

หากต้องการสร้างระบบไฮบริดนี้สำหรับ Example Shoppe คุณควรเริ่มด้วยการกำหนด ระบบเริ่มต้น ในกรณีนี้ คุณควรเริ่มที่ฝั่งไคลเอ็นต์ แอปพลิเคชัน ควรกำหนดเส้นทางไปยัง AI ฝั่งเซิร์ฟเวอร์ใน 2 กรณีต่อไปนี้

  • การสำรองข้อมูลตามความเข้ากันได้: หากอุปกรณ์หรือเบราว์เซอร์ของผู้ใช้จัดการคำขอไม่ได้ ระบบควรสำรองข้อมูลไปยังเซิร์ฟเวอร์
  • การส่งต่อตามความสามารถ: หากคำขอมีความซับซ้อนมากเกินไปหรือเป็นคำขอแบบเปิด สำหรับโมเดลฝั่งไคลเอ็นต์ตามที่กำหนดไว้ในเกณฑ์ที่กำหนดไว้ล่วงหน้า ควรส่งต่อ ไปยังโมเดลฝั่งเซิร์ฟเวอร์ที่ใหญ่กว่า คุณสามารถใช้โมเดลเพื่อจัดประเภทคำขอเป็นคำขอทั่วไป เพื่อให้คุณทำงานฝั่งไคลเอ็นต์ หรือคำขอที่ไม่ธรรมดา และส่งคำขอไปยังระบบฝั่งเซิร์ฟเวอร์ เช่น หาก โมเดลฝั่งไคลเอ็นต์พิจารณาว่าคำถามเกี่ยวข้องกับปัญหาที่พบได้ไม่บ่อย เช่น การขอเงินคืนในสกุลเงินอื่น

ความยืดหยุ่นทำให้เกิดความซับซ้อนมากขึ้น

การกระจายภาระงานระหว่าง 2 แพลตฟอร์มจะช่วยให้คุณมีความยืดหยุ่นมากขึ้น แต่ก็เพิ่มความซับซ้อนด้วยเช่นกัน

  • การประสานงาน: สภาพแวดล้อมการดำเนินการ 2 แบบหมายถึงชิ้นส่วนที่เคลื่อนไหวมากขึ้น คุณ ต้องมีตรรกะสำหรับการกำหนดเส้นทาง การลองใหม่ และการสำรอง
  • การควบคุมเวอร์ชัน: หากคุณใช้โมเดลเดียวกันในแพลตฟอร์มต่างๆ โมเดลนั้นจะต้อง เข้ากันได้กับทั้ง 2 สภาพแวดล้อม
  • การออกแบบพรอมต์และการออกแบบบริบท หากคุณใช้โมเดลที่แตกต่างกันในแต่ละแพลตฟอร์ม คุณจะต้องออกแบบพรอมต์ สำหรับแต่ละแพลตฟอร์ม
  • การตรวจสอบ: บันทึกและเมตริกจะแยกกันและต้องใช้ความพยายามเพิ่มเติมในการรวม
  • ความปลอดภัย: คุณกำลังดูแลพื้นที่การโจมตี 2 แห่ง ทั้งอุปกรณ์ปลายทางในเครื่องและในระบบคลาวด์ ต้องได้รับการเสริมความแข็งแกร่ง

นี่เป็นอีกหนึ่งข้อแลกเปลี่ยนที่คุณควรพิจารณา หากมีทีมขนาดเล็กหรือกำลังสร้างฟีเจอร์ที่ไม่จำเป็น คุณอาจไม่ต้องการเพิ่มความซับซ้อนนี้

สิ่งที่ได้เรียนรู้

คาดว่าตัวเลือกแพลตฟอร์มจะมีการเปลี่ยนแปลง เริ่มต้นจากกรณีการใช้งาน ปรับให้สอดคล้องกับประสบการณ์และทรัพยากรของทีม และทำซ้ำเมื่อทั้งผลิตภัณฑ์และความพร้อมใช้งาน AI เติบโตขึ้น งานของคุณคือการค้นหาส่วนผสมที่เหมาะสมระหว่างความเร็ว ความเป็นส่วนตัว และการควบคุม สำหรับผู้ใช้ จากนั้นสร้างโดยมีความยืดหยุ่น วิธีนี้จะช่วยให้คุณปรับตัวตาม ข้อกำหนดที่เปลี่ยนแปลงไปและรับประโยชน์จากการอัปเดตแพลตฟอร์มและโมเดลในอนาคตได้

แหล่งข้อมูล

ทดสอบความเข้าใจ

อะไรคือ 2 ปัจจัยหลักที่ควรพิจารณาเมื่อเลือกแพลตฟอร์ม AI สำหรับแอปพลิเคชันของคุณ

ภาษาโปรแกรมและเฟรมเวิร์ก
ไม่ถูกต้อง
ค่าใช้จ่ายของโมเดลและความเร็วในการฝึก
เยี่ยมมาก ถูกต้องแล้ว
ตำแหน่งที่โมเดลทำงาน (ในไคลเอ็นต์หรือเซิร์ฟเวอร์) และระดับการควบคุมโมเดล
ไม่ถูกต้อง
ขนาดของทีมพัฒนาและงบประมาณการตลาด
ไม่ถูกต้อง

เมื่อใดที่บริการที่มีการจัดการฝั่งเซิร์ฟเวอร์ เช่น Gemini Pro เป็นตัวเลือกที่ดีที่สุดสำหรับแพลตฟอร์มของคุณ

เมื่อทีมของคุณมีความเชี่ยวชาญด้านแมชชีนเลิร์นนิงอย่างลึกซึ้งและต้องการปรับค่าน้ำหนักด้วยตนเอง
ไม่ถูกต้อง
เมื่อคุณต้องการสร้างต้นแบบอย่างรวดเร็วสำหรับงานการให้เหตุผลที่ซับซ้อนโดยไม่ต้องจัดการโครงสร้างพื้นฐาน
เยี่ยมมาก ถูกต้องแล้ว
เมื่อผู้ใช้ไม่มีการเชื่อมต่ออินเทอร์เน็ต
ไม่ถูกต้อง
เมื่อคุณต้องการเวลาในการตอบสนองที่ต่ำที่สุดเท่าที่จะเป็นไปได้สำหรับเอฟเฟกต์วิดีโอแบบเรียลไทม์
ไม่ถูกต้อง

ประโยชน์หลักของการใช้ระบบ AI แบบไฮบริดคืออะไร

ซึ่งช่วยให้คุณกระจายภาระงานเพื่อเพิ่มประสิทธิภาพการแลกเปลี่ยน เช่น การเรียกใช้งานงานง่ายๆ ในเครื่องเพื่อความเร็ว และงานที่ซับซ้อนในเซิร์ฟเวอร์เพื่อประสิทธิภาพ
เยี่ยมมาก ถูกต้องแล้ว
ซึ่งจะช่วยให้คุณชำระค่าใช้จ่ายทั้งฝั่งไคลเอ็นต์และเซิร์ฟเวอร์เท่ากัน
ไม่ถูกต้อง
ซึ่งบังคับให้ผู้ใช้ดาวน์โหลดโมเดลขนาดใหญ่ทุกครั้งที่เข้าชมเว็บไซต์
ไม่ถูกต้อง
ซึ่งช่วยลดความจำเป็นในการใช้ตรรกะสำรองในโค้ด
ไม่ถูกต้อง