מדדי ביצועים שמתמקדים במשתמשים

כולנו שמענו כמה ביצועים חשובים להם. אבל כשאנחנו מדברים על ביצועים ועל הפיכת אתרים ל"מהירים", למה אנחנו מתכוונים ספציפית?

האמת היא שביצועים הם יחסיים:

  • אתר מסוים עשוי להיות מהיר למשתמש אחד (ברשת מהירה עם מכשיר מתקדם), אבל איטי למשתמש אחר (ברשת איטית עם מכשיר פשוט).
  • שני אתרים עשויים לסיים את הטעינה באותו פרק זמן, אבל אחד מהם ייראה מהיר יותר (אם התוכן נטען בהדרגה, במקום להמתין עד שיוצג לסוף הנתונים).
  • יכול להיות שאתר ייראה שנטען במהירות, אבל אז מגיב לאט (או לא מגיב בכלל) לאינטראקציה של המשתמש.

כשמדברים על ביצועים, חשוב להיות מדויקים במונחים של מדדים. קריטריונים אובייקטיביים שיכולים להיות כמותית אבל חשוב גם לוודא שהמדדים שאתם מודדים שימושי.

הגדרת מדדים

בעבר, ביצועי האינטרנט נמדדו באמצעות האירוע load. עם זאת, למרות ש-load הוא רגע מוגדר היטב במחזור החיים של דף, הרגע הזה לא בהכרח תואם למשהו שחשוב למשתמש.

לדוגמה, שרת יכול להגיב עם דף מינימלי ש"נטענו" באופן מיידי, אבל אז דחיית אחזור תוכן או הצגת תוכן כלשהו בדף עד מספר שניות לאחר הפעלת האירוע load. מבחינה טכנית, לדף כזה יש זמן טעינה מהיר, אבל זמן הטעינה הזה לא מתאים לאופן שבו משתמש חווה את טעינת הדף.

בשנים האחרונות, חברי צוות Chrome - בשיתוף עם קבוצת העבודה לביצועי אינטרנט של W3C - פעלו כדי ליצור סטנדרטיזציה של קבוצה של ממשקי API ומדדים חדשים, שמודדים בצורה מדויקת יותר את האופן שבו משתמשים נהנים מביצועים של דפי אינטרנט.

כדי להבטיח שהמדדים רלוונטיים למשתמשים, אנחנו מגדירים להם כמה שאלות מפתח:

האם זה קורה? הניווט התחיל בהצלחה? האם השרת הגיב?
האם זה שימושי? האם יש מספיק תוכן שעבר רינדור כך שהמשתמשים יכולים לבצע בו פעולות?
אפשר להשתמש בה? האם משתמשים יכולים לקיים אינטראקציה עם הדף, או שהוא עמוס?
איזה כיף? האם האינטראקציות חלקות וטבעיות, ללא עיכובים?

איך המדדים נמדדים

מדדי הביצועים בדרך כלל נמדדים באחת משתי דרכים:

  • בשיעור ה-Lab: שימוש בכלים שמדמה טעינת דף בסביבה עקבית ומבוקרת
  • בשדה: לגבי משתמשים אמיתיים שטוענים את הדף ומקיימים איתו אינטראקציה

אף אחת מהאפשרויות האלה לא בהכרח טובה יותר או גרועה מהשנייה — למעשה, באופן כללי כדאי להשתמש בשתיהן כדי להבטיח ביצועים טובים.

בשיעור ה-Lab

חשוב מאוד לבדוק את הביצועים במעבדה כשמפתחים תכונות חדשות. לפני שהתכונות מושקות בסביבת ייצור, לא ניתן למדוד את מאפייני הביצועים שלהן בקרב משתמשים אמיתיים, ולכן הדרך הטובה ביותר למנוע רגרסיות בביצועים היא לבדוק אותן בשיעור ה-Lab לפני השקת התכונה.

בשדה

מצד שני, בדיקות בשיעור ה-Lab הן מדד סביר לביצועים, אבל הן לא בהכרח משקפות את החוויה של המשתמשים באתר בפועל.

ביצועי האתר יכולים להשתנות באופן משמעותי בהתאם ליכולות המכשיר של המשתמש ולתנאי הרשת שלו. הנתונים עשויים גם להשתנות בהתאם לאינטראקציה של המשתמש עם הדף (או האופן שבו הוא נמצא).

כמו כן, טעינות של דפים הן לא תמיד דטרמיניסטיות. לדוגמה, באתרים שטוענים תוכן או מודעות בהתאמה אישית, מאפייני הביצועים של משתמשים שונים יכולים להיות שונים לחלוטין. בדיקת מעבדה לא תתעד את ההבדלים האלה.

הדרך היחידה לדעת באמת מהם הביצועים של האתר שלכם מבחינת המשתמשים היא למדוד בפועל את הביצועים שלו בזמן שהמשתמשים האלה טוענים אותו ומקיימים איתו אינטראקציה. סוג המדידה הזה נקרא Real User Monitoring (RUM).

סוגי מדדים

יש כמה סוגים אחרים של מדדים שרלוונטיים לאופן שבו המשתמשים תופסים את הביצועים.

  • מהירות הטעינה המוערכת: באיזו מהירות דף יכול לטעון ולעבד את כל הרכיבים החזותיים שלו במסך.
  • טעינת רספונסיביות: המהירות שבה דף יכול לטעון ולהפעיל קוד JavaScript נדרש כדי שהרכיבים מגיבים במהירות לאינטראקציה של המשתמש
  • מהירות תגובה בזמן ריצה: לאחר טעינת הדף, באיזו מהירות הדף יכול להגיב לאינטראקציה של המשתמש.
  • יציבות חזותית: האם הרכיבים בדף משתנים בדרכים שהמשתמשים לא מצפים להן ועלולים להפריע לאינטראקציות?
  • החלקה: האם מעברים ואנימציות עוברים עיבוד בקצב פריימים עקבי ועוברים בצורה חלקה ממצב אחד למצב הבא?

לאור כל הסוגים האלה של מדדי ביצועים, ברור לנו שאף מדד יחיד לא מספיק כדי לייצג את כל מאפייני הביצועים של דף כלשהו.

מדדים שחשוב למדוד

במקרים מסוימים נשיק מדדים חדשים כדי לכסות את התחומים החסרים, אבל במקרים אחרים המדדים הטובים ביותר הם אלה שמותאמים במיוחד לאתר שלכם.

מדדים מותאמים אישית

מדדי הביצועים שצוינו קודם לכן עוזרים להבין באופן כללי את מאפייני הביצועים של רוב האתרים באינטרנט. התכונה הזו טובה גם אם יש להם קבוצה משותפת של מדדים שמאפשרים לאתרים להשוות את הביצועים שלהם לביצועים של המתחרים.

עם זאת, יכול להיות שיהיו מקרים שבהם אתר ספציפי יהיה ייחודי באופן כלשהו שיחייב מדדים נוספים כדי לקבל את התמונה המלאה של רמת הביצועים. לדוגמה, מדד LCP נועד למדוד מתי התוכן הראשי של דף הסתיים, אבל יכולים להיות מקרים שבהם הרכיב הגדול ביותר הוא לא חלק מהתוכן הראשי של הדף, ולכן טבלת ה-LCP לא תהיה רלוונטית.

כדי לטפל במקרים כאלה, קבוצת העבודה בנושא ביצועים באינטרנט קבעה גם ממשקי API סטנדרטיים ברמה נמוכה יותר שיכולים להיות שימושיים להטמעת מדדים מותאמים אישית משלכם:

במדריך בנושא מדדים מותאמים אישית מוסבר איך להשתמש בממשקי ה-API האלה כדי למדוד מאפייני ביצועים ספציפיים לאתר שלכם.