בינה מלאכותית חיזויית מחלצת תובנות מנתונים קיימים, אבל בינה מלאכותית גנרטיבית עושה צעד נוסף ויוצרת משהו חדש. הוא יכול לכתוב טקסט, ליצור תמונות, לייצר קוד או אפילו לעצב ממשקי משתמש מלאים. ריכזנו כאן כמה דוגמאות נפוצות לתרחישי שימוש ב-AI גנרטיבי:
- יצירת תוכן: עוזרים לכתיבה מבוססי-AI יכולים ליצור טיוטות ולשפר טקסט קיים.
- סיכום: כלים כמו תקצירי AI של Google מאפשרים לצמצם מסמכים ארוכים, פגישות או דפי אינטרנט לסיכומים תמציתיים ושימושיים.
- יצירת קוד: כלי פיתוח משתמשים ב-AI גנרטיבי כדי לכתוב ולשכתב קוד, וכך משפרים את הפרודוקטיביות של המפתחים.
- יצירת תמונות ונכסים: באמצעות מודלים של ראייה ממוחשבת, המשתמשים יכולים ליצור נכסים חזותיים, כמו באנרים ותמונות ממוזערות.
הלולאה של ה-AI הגנרטיבי
רוב המודלים של AI גנרטיבי מאומנים באמצעות רשתות עצביות וארכיטקטורות של טרנספורמרים. המודלים לומדים להציע את האלמנט הבא ברצף, כמו המילה הבאה, הפיקסל או ההערה, על סמך האלמנטים הקודמים.
מבחינה מתמטית, זה לא רחוק מ-AI חיזוי. שניהם לומדים דפוסים מנתונים. ההבדל הוא בסדר הגודל.
ב-AI חיזוי, אפשרויות הפלט מוגבלות לכמה תוויות, כמו 'נטישה' או 'ללא נטישה'. ב-AI גנרטיבי, מרחב הפלט יכול לכלול מאות אלפי אפשרויות. מנגנון החיזוי, שאומן על מיליארדי דוגמאות, הופך למנוע רב-עוצמה שמסוגל ליצור פלטים חדשים שלא נראו קודם.
פיתוח של מערכת AI גנרטיבי מתבצע בגישה איטרטיבית.
נראה איך זה עובד באמצעות האפליקציה לדוגמה שלנו, BlogBuddy, שהיא עוזרת למערכת לניהול תוכן, ומסייעת למשתמשים ליצור תיאורים מושכים וכותרות של מאמרים שמתאימות לקידום אתרים.
הגדרת תרחיש השימוש
הצהרת הבעיה צריכה לכלול:
- אופן הקלט והפלט. התוכן יכול להיות טקסט (פרוזה או קוד), תמונות או אודיו.
- שיטת קלט. האם התוכן הגיע משדה העלאה, מטקסט חופשי או מקלט אחר של נתוני מבנה?
- קהל. מי מבצע את המשימה הזו? האם יש להם ידע כללי או שהם צריכים ידע מיוחד?
התכונות של BlogBuddy מתמקדות ביצירת טקסט. הקלט הוא חצי מובנה: המשתמשים מספקים נושא או טיוטה קצרה, והמודל מחזיר וריאציות. הקהל הוא שיווקי, עם ידע מיוחד בתחום העריכה.
חשוב להגדיר תקן איכות לפלט. במקרה שלנו, אנחנו רוצים ליצור טקסט קצר, קל לסריקה ועשיר במילות מפתח, שמתאים לסגנון של הפרסום.
מדדים ברורים להצלחה עוזרים לכם להמשיך את התהליך. מידע נוסף על איסוף מדדי הצלחה זמין במאמר בנושא פיתוח מבוסס-הערכה.
בחירת מודל הבסיס
יש מגוון רחב של מודלים זמינים שעברו אימון מראש על מערכי נתונים גדולים ואוניברסליים. אפשר להתאים את ההתנהגות שלהם לצרכים ספציפיים. מודלים של AI גנרטיבי הם בדרך כלל גדולים ומורכבים בהרבה ממודלים חיזויים, ולכן מומלץ לבנות על בסיס מודל קיים, ולא לבנות ולאמן מודל משלכם.
הבחירה שלכם קובעת את היכולות של המוצר, העלות, האפשרויות להתאמה אישית והגבולות של הפרטיות. בחירת המודל תלויה מאוד בפלטפורמה שבה פורסים את מערכת ה-AI.
בהמשך הקורס תלמדו איך לבחור את הפלטפורמה.
הנדסת הנחיות והקשר
אחרי שבוחרים את המודל, צריך להזין לו את ההוראות הנכונות באמצעות הנחיה. לדוגמה, כדי להשתמש ב-BlogBuddy, אפשר להזין את ההנחיה הבאה למודל:
Generate three short, engaging title suggestions for this article
יש כמה סוגי מידע שאפשר להוסיף להנחיה. לדוגמה:
- הנחיית מערכת שמגדירה התנהגות כללית.
- הקשר ספציפי לקלט של המשימה הנוכחית.
- הוראות למשתמשים באפליקציות שיחה, כמו צ'אטבוטים או סוכנים.
הסקת מסקנות ועיבוד לאחר מכן
אחרי שההנחיה מורכבת, היא נשלחת למודל כדי להסיק מסקנות. אתם יכולים לשנות פרמטרים של המודל, כולל הטמפרטורה (ליצירתיות) והכמות המקסימלית של טוקנים (לאורך ולמלל), כדי לשנות את אופן התגובה של המודל. אחרי היצירה, הפלט עובר עיבוד באמצעות כללים נוספים ואמצעי הגנה.
לדוגמה, אפשר לנסח מחדש טקסט עם הטיה מגדרית, לשנות את הטון או לסנן מונחים אסורים.
כדי לתמוך בשקיפות ובכיול של רמת האמון, אפשר להוסיף מודל משני קטן יותר כדי לסווג או לסכם את התוצאה. לדוגמה: 'מבוא שנוצר מ-12 מאמרים קשורים. רמת מהימנות: גבוהה."
לולאת הערכה ומשוב
מרחב הפלט של ה-AI הגנרטיבי הוא כמעט אינסופי, ולכן לרוב ההנחיות אין תשובה נכונה אחת. מדדים סטנדרטיים, כמו MMLU או SQuAD, יכולים למדוד את היכולת הכללית של המודל, אבל הם לא משקפים את הצרכים הספציפיים של משתמשים אנושיים. בהקשר של מוצר, צריך להגדיר שילוב משלכם של מדדים איכותיים וכמותיים:
- דיוק: האם הפלט נכון עובדתית?
- האם התוצאה שימושית: האם הפלט עומד בציפיות שהוגדרו בהנחיה או בכוונה של המשתמש?
- קריאות וטון: האם הפלט ברור ותואם לסטנדרטים של המותג?
- מאמץ אנושי: כמה עריכה או אוצרות ידניים נדרשים?
- הבנת הדומיין: האם הפלט משקף ידע ספציפי לדומיין?
כדי להעריך את המדדים האלה, אפשר לשלב בין בדיקה אנושית לבין ניקוד אוטומטי. לדוגמה, אפשר לבקש מהמשתמשים לדרג פלט בעולם האמיתי, להשתמש במודל שני להערכה אוטומטית (שנקראת גם LLM-as-a-judge) ולבצע בדיקות פנימיות תקופתיות כדי לזהות הטיה או הזיות.
נתוני שימוש אמיתיים הם אחד הנכסים הכי חשובים שלכם כשאתם יוצרים תוכן באמצעות AI גנרטיבי. אם אפשר, כדאי לתעד את האינטראקציות האלה כדי לשנות את ההנחיות וההקשרים, לבדוק מודלים שונים או לשנות את הפרמטרים לאורך זמן. כל אינטראקציה של משתמש, תיקון או דירוג הופכים למשוב שיכול לעזור לכם לקבוע את השלבים הבאים באופטימיזציה:
- קלט משתמשים לא צפוי יכול לעזור לכם לקבוע אם אתם פותרים את הבעיה הנכונה.
- בקשות חוזרות שספציפיות לדומיין יכולות לעזור לכם לבחור מודל. יכול להיות שתעברו ממודל LLM גדול וכללי למודל קטן ומכוונן.
- הזיות חוזרות יכולות להצביע על חוסר הקשר ספציפי בהנחיות.
- עריכות נרחבות יכולות להצביע על חוסר הקשר המשותף. המודל לא מכיר מידע שהמשתמש לוקח כמובן מאליו.
עם הזמן, לולאות המשוב האלה הופכות את תכונת ה-AI הגנרטיבי מקריאה סטטית של מודל למערכת חיה שמתאימה את עצמה באופן רציף לצרכים ולהעדפות של המשתמשים.
בעיות נפוצות ופתרונות
מכיוון ש-AI גנרטיבי פועל במרחב פתוח של קלט ופלט, פני השטח של הסיכון שלו רחבים הרבה יותר מאשר במערכות חיזוי. בנוסף ליצירת תוצאות שגויות, הוא יכול ליצור תוכן רעיל, מוטה או מטעה, או אפילו לתמרן משתמשים שלא במכוון. הכשלים האלה עלולים לפגוע באמון ולחשוף את החברה שלכם להשלכות כספיות או משפטיות.
לכן, כדי להשתמש ב-AI גנרטיבי, צריך לנקוט בגישה פרואקטיבית ומתמשכת לניהול סיכונים. אלה כמה מהסיכונים הנפוצים ביותר:
- הזיה: המודל ממציא עובדות או מציג פרטים בצורה לא נכונה. כדי לצמצם את הבעיה, אפשר להשתמש ב-RAG כדי להבטיח שהתשובות יתבססו על עובדות.
- ביטחון מוגזם: המשתמשים מניחים שהתוצאות תמיד נכונות. כדי לצמצם את הסיכון, מומלץ לעודד תהליך של בדיקה ועריכה במקום פרסום אוטומטי. במאמר AI governance: Building responsibly (ניהול AI: בנייה אחראית), תלמדו איך לעזור למשתמשים לכייל את רמת האמון שלהם.
- חוסר עקביות: יש הבדלים גדולים בין הפלטים של הרצות שונות. כדי לצמצם את הבעיה, אפשר להשתמש בתבניות של הנחיות, בבקרה על הטמפרטורה או בדוגמאות של למידה עם מספר קטן של דוגמאות כדי לייצב את הטון והמבנה.
- תוכן רעיל או מזיק: המודל יוצר טקסט מוטה, פוגעני או מניפולטיבי. כדי לצמצם את הסיכון, כדאי להחיל מסנני מודרציה ומסווגי רעילות לפני ההצגה. בודקים באופן רציף את התוצאות באמצעות הנחיות אמיתיות, ומקפידים על לולאת משוב כדי לסמן מקרים חריגים ולבצע אימון מחדש בהתאם.
- זמן האחזור והעלות: מודלים גדולים יכולים להיות איטיים ויקרים. במיוחד אם אתם רוצים להטמיע את המודלים בהיקף נרחב, יכול להיות שיהיה לכם קשה להעריך מראש את העלות ואת השימוש במשאבים. כדי לצמצם את הסיכון, אפשר להשתמש במטמון, באגירת נתונים ובמודלים קטנים יותר למשימות קצרות.
התובנות שלכם
בקיצור, AI גנרטיבי הופך רעיונות גולמיים לתוכן מוחשי כמו טקסטים, תמונות, קוד או שיחות. היא מתאימה במיוחד למקרים שבהם היצירתיות וההתאמה חשובות יותר מהדיוק.
כמפתחי אתרים, ההצלחה שלכם תלויה בעיצוב ההנחיות הנכונות, בהתבססות של המודל על הנתונים הנכונים ובהתאמה מתמשכת של המערכת להעדפות המשתמשים.
משאבים
מידע נוסף על בחירת מודלים קטנים יותר ומתאימים לשימוש לאורך זמן למידה מתקדמת יותר:
- מומלץ לעבור את הקורס המקוצר על למידת מכונה ב-AI גנרטיבי.
- מומלץ לעיין בערכת הכלים לשימוש אחראי ב-AI גנרטיבי.
- כדי לקרוא מידע נוסף על הסוגים השונים של מודלים בסיסיים ב-AI גנרטיבי, אפשר לעיין בפרק 5 בספר The Art of AI Product Development.
בדיקת ההבנה
מה ההבדל העיקרי בין פלט של AI גנרטיבי לבין פלט של AI לחיזוי?
מה התפקיד של טמפרטורת המודל?
למה מדדים סטנדרטיים לא מספיקים כדי להעריך בינה מלאכותית גנרטיבית?
איזו מהאפשרויות הבאות היא דרך נפוצה לצמצום הזיות?
מה צריך לעשות עם משוב ממשתמשים, לפי לולאת ה-AI הגנרטיבי?