تحقیق و روش شناسی پشت آستانه های Core Web Vitals
تاریخ انتشار: 21 می 2020
Core Web Vitals مجموعهای از معیارهای میدانی هستند که جنبههای مهم تجربه کاربر در دنیای واقعی را در وب اندازهگیری میکنند. Core Web Vitals شامل معیارها و همچنین آستانه های هدف برای هر معیار است که به توسعه دهندگان کمک می کند تا درک کنند که آیا تجربه سایت آنها "خوب"، "نیاز به بهبود" است یا "ضعیف" است. این پست به طور کلی رویکرد مورد استفاده برای انتخاب آستانه برای معیارهای Core Web Vitals و همچنین نحوه انتخاب آستانه برای هر معیار Core Web Vitals خاص را توضیح خواهد داد.
Refresher: معیارها و آستانه های Core Web Vitals
Core Web Vitals سه معیار است: بزرگترین رنگ محتوایی (LCP)، تعامل با رنگ بعدی (INP) و تغییر چیدمان تجمعی (CLS). هر معیار جنبه متفاوتی از تجربه کاربر را اندازهگیری میکند: LCP سرعت بارگذاری درک شده را اندازهگیری میکند و نقطهای را در جدول زمانی بارگذاری صفحه مشخص میکند که محتوای اصلی صفحه احتمالاً بارگیری شده است. INP پاسخگویی را اندازه گیری می کند و تجربه ای که کاربران هنگام تلاش برای تعامل با صفحه احساس می کنند را کمی می کند. و CLS ثبات بصری را اندازه گیری می کند و مقدار تغییر طرح غیرمنتظره محتوای صفحه قابل مشاهده را تعیین می کند.
هر معیار Core Web Vitals آستانههای مرتبطی دارد که عملکرد را به عنوان «خوب»، «نیاز به بهبود» یا «ضعیف» طبقهبندی میکند:
خوب | بیچاره | صدک | |
---|---|---|---|
بزرگترین رنگ محتوایی | ≤2500 میلیثانیه | > 4000 میلیثانیه | 75 |
تعامل با Next Paint | ≤200 میلیثانیه | > 500 میلیثانیه | 75 |
تغییر چیدمان تجمعی | ≤0.1 | >0.25 | 75 |
علاوه بر این، برای طبقه بندی عملکرد کلی یک صفحه یا سایت، از ارزش صدک 75 تمام بازدیدهای صفحه در آن صفحه یا سایت استفاده می کنیم. به عبارت دیگر، اگر حداقل 75 درصد از بازدیدهای صفحه از یک سایت، آستانه "خوب" را برآورده کنند، سایت به عنوان دارای عملکرد "خوب" برای آن معیار طبقه بندی می شود. برعکس، اگر حداقل 25 درصد از بازدیدهای صفحه آستانه "ضعیف" را داشته باشند، سایت به عنوان دارای عملکرد "ضعیف" طبقه بندی می شود. بنابراین، برای مثال، یک LCP صدک 75 2 ثانیه به عنوان "خوب" طبقه بندی می شود، در حالی که یک LCP صدک 75 5 ثانیه به عنوان "ضعیف" طبقه بندی می شود.
معیارهای آستانه متریک Core Web Vitals
در این بخش، معیارهای ارزیابی آستانه های متریک Core Web Vitals را بررسی خواهیم کرد. بخشهای بعدی به جزئیات بیشتری در مورد نحوه اعمال این معیارها برای انتخاب آستانه برای هر معیار میپردازد. در سالهای آینده، ما پیشبینی میکنیم که برای بهبود بیشتر توانایی خود برای اندازهگیری تجربیات عالی کاربران در وب، بهبودها و اضافههایی در معیارها و آستانهها ایجاد کنیم.
تجربه کاربری با کیفیت بالا
هدف اصلی ما بهینه سازی برای کاربر و کیفیت تجربه آنهاست. با توجه به این موضوع، هدف ما تضمین این است که صفحاتی که آستانههای «خوب» Core Web Vitals را برآورده میکنند، تجربه کاربری با کیفیت بالایی را ارائه میکنند.
برای شناسایی یک آستانه مرتبط با تجربه کاربری با کیفیت بالا، ما به ادراک انسانی و تحقیقات HCI نگاه می کنیم. در حالی که این تحقیق گاهی با استفاده از یک آستانه ثابت خلاصه میشود، متوجه میشویم که تحقیقات اساسی معمولاً به عنوان طیفی از مقادیر بیان میشود. به عنوان مثال، تحقیقات در مورد مدت زمانی که کاربران معمولاً قبل از از دست دادن تمرکز منتظر میمانند، گاهی اوقات به عنوان 1 ثانیه توصیف میشود، در حالی که تحقیقات زیربنایی در واقع به صورت محدودهای از صدها میلیثانیه تا چند ثانیه بیان میشود. این واقعیت که آستانه درک بسته به کاربر و زمینه متفاوت است، بیشتر توسط دادههای متریک کروم جمعآوریشده و ناشناس پشتیبانی میشود، که نشان میدهد یک مقدار زمانی وجود ندارد که کاربران قبل از لغو بارگذاری صفحه برای نمایش محتوا منتظر یک صفحه وب باشند. بلکه این داده ها توزیعی هموار و پیوسته را نشان می دهد. برای نگاهی عمیق تر به آستانه های ادراک انسانی و تحقیقات مرتبط HCI، به The Science Behind Web Vitals مراجعه کنید.
در مواردی که تحقیقات مربوط به تجربه کاربر برای یک معیار معین در دسترس است و توافق منطقی در مورد دامنه مقادیر در ادبیات وجود دارد، ما از این محدوده به عنوان ورودی برای هدایت فرآیند انتخاب آستانه استفاده میکنیم. در مواردی که تحقیق مربوط به تجربه کاربر در دسترس نیست، مانند معیارهای جدیدی مانند تغییر چیدمان تجمعی، ما در عوض صفحات دنیای واقعی را که آستانههای نامزد متفاوتی را برای یک متریک برآورده میکنند، ارزیابی میکنیم تا آستانهای را که منجر به تجربه کاربری خوب میشود، شناسایی کنیم.
با محتوای موجود وب قابل دستیابی است
علاوه بر این، برای اطمینان از اینکه صاحبان سایت می توانند در بهینه سازی سایت های خود برای رسیدن به آستانه های "خوب" موفق شوند، ما نیاز داریم که این آستانه ها برای محتوای موجود در وب قابل دستیابی باشد. برای مثال، در حالی که صفر میلیثانیه یک آستانه ایدهآل LCP «خوب» است که منجر به تجربههای بارگذاری فوری میشود، آستانه صفر میلیثانیه به دلیل تأخیرهای پردازش شبکه و دستگاه عملاً در اکثر موارد قابل دستیابی نیست. بنابراین، صفر میلی ثانیه یک آستانه معقول LCP "خوب" برای Core Web Vitals نیست.
هنگام ارزیابی آستانههای «خوب» Core Web Vitals نامزد، تأیید میکنیم که این آستانهها بر اساس دادههای گزارش تجربه کاربر Chrome (CrUX) قابل دستیابی هستند. برای تأیید دستیابی به یک آستانه، ما نیاز داریم که حداقل 10٪ از مبداها آستانه "خوب" را داشته باشند. بهعلاوه، برای اطمینان از اینکه سایتهای بهینهشده به دلیل تنوع در دادههای میدانی اشتباه طبقهبندی نمیشوند، همچنین تأیید میکنیم که محتوای بهینهشده بهطور مداوم آستانه «خوب» را برآورده میکند.
برعکس، ما آستانه «ضعیف» را با شناسایی سطحی از عملکرد که فقط تعداد کمی از منشاء آن را برآورده نمیکنند، تعیین میکنیم. بهطور پیشفرض، 10 تا 30 درصد از مبداهایی که بدترین عملکرد را دارند، بهعنوان «ضعیف» طبقهبندی میشوند، مگر اینکه تحقیقات مرتبط با تعریف آستانه «ضعیف» وجود داشته باشد.
اینکه آیا معیارهای یکسان یا متفاوت در هر دستگاه وجود داشته باشد
استفاده از موبایل و دسکتاپ معمولاً از نظر قابلیت های دستگاه و قابلیت اطمینان شبکه دارای ویژگی های بسیار متفاوتی است. این به شدت بر معیارهای "دستیابی" تأثیر می گذارد و بنابراین نشان می دهد که ما باید آستانه های جداگانه ای را برای هر یک در نظر بگیریم.
با این حال، انتظارات کاربران از یک تجربه خوب یا ضعیف به دستگاه بستگی ندارد، حتی اگر معیار دستیابی باشد. به همین دلیل آستانه های توصیه شده Core Web Vitals بر اساس دستگاه تفکیک نمی شوند و از آستانه یکسانی برای هر دو استفاده می شود. این همچنین مزیت دیگری دارد که آستانه ها را ساده تر می کند.
علاوه بر این، دستگاه ها همیشه به خوبی در یک دسته قرار نمی گیرند. آیا این باید بر اساس ضریب شکل دستگاه، قدرت پردازش یا شرایط شبکه باشد؟ داشتن آستانه های یکسان دارای مزیت جانبی اجتناب از این پیچیدگی است.
ماهیت محدودتر دستگاه های تلفن همراه به این معنی است که بسیاری از آستانه ها بر اساس قابلیت دستیابی تلفن همراه تنظیم می شوند. آنها به احتمال زیاد آستانه های تلفن همراه را نشان می دهند - به جای یک آستانه مشترک واقعی در همه انواع دستگاه. با این حال، با توجه به اینکه تلفن همراه اغلب بیشترین ترافیک بیشتر سایتها را تشکیل میدهد ، این موضوع کمتر نگران کننده است.
نظرات نهایی در مورد معیارها
هنگام ارزیابی آستانه نامزدها، متوجه شدیم که معیارها گاهی اوقات با یکدیگر در تضاد بودند. برای مثال، میتواند تنشی بین آستانهای وجود داشته باشد که دائماً قابل دستیابی است و تجربههای کاربر خوب را تضمین میکند. علاوه بر این، با توجه به اینکه تحقیقات ادراک انسانی معمولاً طیف وسیعی از مقادیر را ارائه میکند و معیارهای رفتار کاربر تغییرات تدریجی در رفتار را نشان میدهند، ما دریافتیم که اغلب هیچ آستانه «درست» واحدی برای یک معیار وجود ندارد. بنابراین، رویکرد ما برای Core Web Vitals این بوده است که آستانههایی را انتخاب کنیم که به بهترین وجه معیارها را برآورده میکنند، در حالی که تشخیص میدهیم که یک آستانه کامل وجود ندارد و ممکن است گاهی لازم باشد از بین آستانههای نامزد معقول متعدد انتخاب کنیم. به جای اینکه بپرسید "آستانه کامل چیست؟" ما در عوض روی این سوال تمرکز کردیم که "کدام آستانه نامزد به بهترین وجه به معیارهای ما می رسد؟"
انتخاب صدک
همانطور که قبلا ذکر شد، برای طبقه بندی عملکرد کلی یک صفحه یا سایت، از ارزش صدک 75 تمام بازدیدهای آن صفحه یا سایت استفاده می کنیم. صدک 75 بر اساس دو معیار انتخاب شد. اول، صدک باید اطمینان حاصل کند که اکثر بازدیدکنندگان از یک صفحه یا سایت، سطح عملکرد هدف را تجربه کرده اند. دوم، مقدار در صدک انتخابی نباید بیش از حد تحت تأثیر عوامل پرت قرار گیرد.
این اهداف تا حدودی با یکدیگر در تضاد هستند. برای ارضای هدف اول، یک صدک بالاتر معمولاً انتخاب بهتری است. با این حال، با صدک های بالاتر، احتمال اینکه مقدار حاصل تحت تأثیر مقادیر پرت قرار گیرد نیز افزایش می یابد. اگر چند بازدید از یک سایت روی اتصالات شبکه ورقهای باشد که منجر به نمونههای LCP بسیار بزرگ میشود، ما نمیخواهیم طبقهبندی سایت ما با این نمونههای پرت تعیین شود. به عنوان مثال، اگر ما عملکرد یک سایت را با 100 بازدید با استفاده از یک صدک بالا مانند 95 ارزیابی کنیم، فقط 5 نمونه پرت نیاز است تا مقدار صدک 95 تحت تاثیر نقاط پرت قرار گیرد.
با توجه به اینکه این اهداف کمی در تضاد هستند، پس از تجزیه و تحلیل، به این نتیجه رسیدیم که صدک 75 تعادل معقولی ایجاد می کند. با استفاده از صدک 75، می دانیم که اکثر بازدیدکنندگان از سایت (3 از 4) سطح عملکرد هدف یا بهتر را تجربه کرده اند. علاوه بر این، مقدار صدک 75 کمتر تحت تأثیر عوامل پرت است. با بازگشت به مثال ما، برای سایتی با 100 بازدید، 25 مورد از این بازدیدها باید نمونه های پرت بزرگ را گزارش کنند تا مقدار در صدک 75 تحت تأثیر عوامل پرت قرار گیرد. در حالی که 25 نمونه از 100 نمونه ممکن است پرت باشند، احتمال آن بسیار کمتر از مورد صدک 95 است.
بزرگترین رنگ محتوایی
آستانه های LCP با کیفیت تجربه و ملاحظات دست یافتنی زیر تعیین شدند.
کیفیت تجربه
1 ثانیه اغلب به عنوان مدت زمانی ذکر می شود که کاربر قبل از اینکه تمرکز خود را روی یک کار از دست بدهد منتظر بماند. با بررسی دقیق تر تحقیقات مربوطه، متوجه شدیم که 1 ثانیه تقریبی برای توصیف طیفی از مقادیر، از تقریباً چند صد میلی ثانیه تا چند ثانیه است.
دو منبع متداول ذکر شده برای آستانه 1 ثانیه عبارتند از Card and others و Miller . Card با استناد به نظریههای یکپارچه شناخت نیوول، آستانه ۱ ثانیهای «پاسخ فوری» را تعریف میکند. نیوول پاسخهای فوری را اینگونه توضیح میدهد: «پاسخهایی که باید به محرکهایی در عرض تقریباً یک ثانیه داده شوند (یعنی تقریباً از 0.3 تا 3 ثانیه.» این به دنبال بحث نیوول در مورد "محدودیت های زمان واقعی در شناخت" است، جایی که اشاره می شود که "تعاملات با محیطی که ملاحظات شناختی را برمی انگیزد به ترتیب ثانیه ها انجام می شود" که از حدود 0.5 تا 2-3 ثانیه متغیر است. میلر، منبع دیگری که معمولاً برای آستانه 1 ثانیه ذکر میشود، خاطرنشان میکند: «کارهایی که انسانها میتوانند با ارتباطات ماشینی انجام دهند و انجام خواهند داد، در صورتی که تأخیر در پاسخ بیش از دو ثانیه باشد، با احتمال طولانی شدن یک ثانیه یا بیشتر، شخصیت آنها به طور جدی تغییر میکند».
تحقیقات میلر و کارت مدت زمانی را که کاربر قبل از از دست دادن تمرکز منتظر میماند به عنوان یک محدوده، از تقریباً 0.3 تا 3 ثانیه توصیف میکند، که نشان میدهد آستانه "خوب" LCP ما باید در این محدوده باشد. علاوه بر این، با توجه به اینکه آستانه "خوب" First Contentful Paint موجود 1 ثانیه است، و اینکه بزرگترین رنگ محتوایی معمولاً بعد از First Contentful Paint رخ می دهد، ما دامنه آستانه های LCP نامزد خود را بیشتر از 1 ثانیه به 3 ثانیه محدود می کنیم. برای انتخاب آستانهای در این محدوده که به بهترین وجه با معیارهای ما مطابقت دارد، در ادامه به دستیابی به این آستانههای نامزد میپردازیم.
دست یافتنی
با استفاده از دادههای CrUX، میتوانیم درصد مبداهای موجود در وب را تعیین کنیم که آستانههای «خوب» LCP نامزد ما را برآورده میکنند.
1 ثانیه | 1.5 ثانیه | 2 ثانیه | 2.5 ثانیه | 3 ثانیه | |
---|---|---|---|---|---|
تلفن | 3.5٪ | 13% | 27% | 42% | 55% |
دسکتاپ | 6.9٪ | 19% | 36% | 51% | 64% |
در حالی که کمتر از 10٪ از مبداها آستانه 1 ثانیه را برآورده می کنند، همه آستانه های دیگر از 1.5 تا 3 ثانیه شرایط ما را برآورده می کنند که حداقل 10٪ از مبداها آستانه "خوب" را برآورده کنند، و بنابراین هنوز کاندیدای معتبر هستند.
علاوه بر این، برای اطمینان از اینکه آستانه انتخاب شده به طور مداوم برای سایتهای بهینهسازی شده قابل دستیابی است، عملکرد LCP را برای سایتهای با عملکرد برتر در سراسر وب تجزیه و تحلیل میکنیم تا تعیین کنیم که کدام آستانهها به طور مداوم برای این سایتها قابل دستیابی هستند. به طور خاص، هدف ما شناسایی آستانه ای است که به طور مداوم در صدک 75 برای سایت های دارای عملکرد برتر قابل دستیابی است. ما متوجه شدیم که آستانه های 1.5 و 2 ثانیه به طور مداوم قابل دستیابی نیستند، در حالی که 2.5 ثانیه به طور مداوم قابل دستیابی است.
برای شناسایی آستانه «ضعیف» برای LCP، از دادههای CrUX برای شناسایی آستانهای استفاده میکنیم که توسط اکثر مبداها برآورده شده است:
3 ثانیه | 3.5 ثانیه | 4 ثانیه | 4.5 ثانیه | 5 ثانیه | |
---|---|---|---|---|---|
تلفن | 45% | 35% | 26% | 20% | 15% |
دسکتاپ | 36% | 26% | 19% | 14% | 10% |
برای آستانه 4 ثانیه، تقریباً 26٪ از مبدا تلفن و 21٪ از مبدا دسکتاپ به عنوان ضعیف طبقه بندی می شوند. این در محدوده هدف ما 10-30٪ قرار می گیرد، بنابراین نتیجه می گیریم که 4 ثانیه آستانه "ضعیف" قابل قبولی است.
بنابراین، نتیجه می گیریم که 2.5 ثانیه یک آستانه معقول "خوب" و 4 ثانیه یک آستانه معقول "ضعیف" برای بزرگترین رنگ محتوایی است.
تعامل با Next Paint
آستانه های INP با کیفیت تجربه و ملاحظات دست یافتنی زیر تعیین شدند.
کیفیت تجربه
تحقیقات در نتیجه گیری اینکه تاخیر در بازخورد بصری تا حدود 100 میلی ثانیه به عنوان یک منبع مرتبط، مانند ورودی کاربر، ایجاد می شود، به طور منطقی سازگار است. این نشان می دهد که آستانه "خوب" Interaction ایده آل برای Next Paint نزدیک به این خواهد بود.
یاکوب نیلسن که معمولاً به آن اشاره میشود : 3 محدودیت مهم، 0.1 ثانیه را به عنوان محدودیتی برای اینکه کاربر احساس کند سیستم فوراً واکنش نشان میدهد، تعریف میکند. نیلسن از میلر و کارد استناد میکند که میشوت در سال 1962 به «درک علیت» اشاره میکند. در تحقیقات Michotte، به شرکت کنندگان آزمایش نشان داده می شود "دو شی روی صفحه نمایش. شی A حرکت می کند و به سمت B حرکت می کند. در لحظه ای که با B تماس پیدا می کند متوقف می شود، در حالی که دومی شروع می شود و از A دور می شود." Michotte فاصله زمانی بین توقف شی A و زمانی که شی B شروع به حرکت می کند تغییر می دهد. Michotte دریافت که برای تاخیرهای تقریباً 100 ms، شرکت کنندگان این تصور را دارند که جسم A باعث حرکت شی B می شود. حرکت جسم B دیگر توسط جسم A ایجاد شده است.
به طور مشابه، میلر یک آستانه پاسخ را برای "پاسخ به فعال سازی کنترل" اینگونه تعریف می کند: "نشان دهنده عملی است که معمولاً با حرکت کلید، سوئیچ یا سایر اعضای کنترلی که سیگنال فعال شدن فیزیکی آن را نشان می دهد ارائه می شود. این پاسخ باید ... درک شود. به عنوان بخشی از عمل مکانیکی القا شده توسط اپراتور: تاخیر زمانی: بیش از 0.1 ثانیه و بعداً "تأخیر بین فشار دادن یک کلید و بازخورد بصری نباید بیشتر از 0.1 تا 0.2 ثانیه باشد.
اخیراً، در کتاب Towards the Temporally Perfect Virtual Button ، Kaaresoja و دیگران درک همزمانی بین لمس یک دکمه مجازی روی صفحه لمسی و بازخورد بصری بعدی که نشان میدهد دکمه لمس شده است را برای تاخیرهای مختلف بررسی کردند. هنگامی که تاخیر بین فشار دادن دکمه و بازخورد بصری 85 میلیثانیه یا کمتر بود، شرکتکنندگان گزارش دادند که بازخورد بصری همزمان با فشار دادن دکمه در 75 درصد مواقع ظاهر میشود. علاوه بر این، برای تأخیرهای 100 میلیثانیه یا کمتر، شرکتکنندگان کیفیت درک مداوم فشار دکمه را گزارش کردند، کیفیت درک شده برای تأخیرهای 100 میلیثانیه تا 150 میلیثانیه کاهش مییابد و برای تأخیرهای 300 میلیثانیه به سطوح بسیار پایین میرسد.
با توجه به این، نتیجه می گیریم که تحقیقات به 100 میلی ثانیه به عنوان یک تعامل "خوب" با آستانه رنگ بعدی برای Web Vitals اشاره می کند. علاوه بر این، با توجه به گزارش کاربران سطوح پایین کیفیت برای تأخیرهای 300 میلیثانیه یا بیشتر، در حالت ایدهآل این آستانه «ضعیف» خواهد بود.
دست یافتنی
با استفاده از دادههای CrUX، ما تعیین میکنیم که اکثر مبداهای موجود در وب، آستانه 200 میلیثانیه INP "خوب" در صدک 75 را برآورده میکنند:
100 میلیثانیه | 200 میلیثانیه | 300 میلیثانیه | 400 میلیثانیه | 500 میلیثانیه | |
---|---|---|---|---|---|
تلفن | 12% | 56% | 76% | 88% | 92% |
دسکتاپ | 83% | 96% | 98% | 99% | 99% |
ما همچنین توجه بیشتری را به بررسی امکان دسترسی به INP برای دستگاه های تلفن همراه پایین تر، که در آن نسبت بالایی از بازدید از سایت ها را تشکیل می دادند، صرف کردیم. این بیشتر مناسب بودن آستانه 200 میلی ثانیه را تأیید کرد.
با در نظر گرفتن آستانه 100 میلی ثانیه که توسط تحقیقات در مورد کیفیت تجربه و معیارهای دستیابی پشتیبانی می شود، نتیجه می گیریم که 200 میلی ثانیه آستانه معقولی برای تجربیات خوب است.
برای شناسایی آستانه «ضعیف» برای LCP، از دادههای CrUX برای شناسایی آستانهای استفاده میکنیم که توسط اکثر مبداها برآورده شده است:
100 میلیثانیه | 200 میلیثانیه | 300 میلیثانیه | 400 میلیثانیه | 500 میلیثانیه | |
---|---|---|---|---|---|
تلفن | 88% | 44% | 24% | 12% | 8% |
دسکتاپ | 17% | 4% | 2% | 1% | 1% |
این نشان می دهد که ما می توانیم آستانه "ضعیف" 300 میلی ثانیه داشته باشیم.
با این حال، برخلاف LCP و CLS، INP با محبوبیت همبستگی معکوس دارد - سایت های محبوب تر اغلب پیچیده تر هستند و در نتیجه احتمال INP بالاتر بیشتر می شود. وقتی به 10000 سایت برتر نگاه می کنیم - که اکثریت قریب به اتفاق مرورهای اینترنتی را تشکیل می دهند - تصویر پیچیده تری را می بینیم:
100 میلیثانیه | 200 میلیثانیه | 300 میلیثانیه | 400 میلیثانیه | 500 میلیثانیه | |
---|---|---|---|---|---|
تلفن | 97% | 77% | 55% | 37% | 24% |
دسکتاپ | 48% | 17% | 8% | 4% | 2% |
در تلفن همراه، آستانه 300 میلیثانیه «ضعیف» اکثر سایتهای پرطرفدار را بهعنوان «ضعیف» طبقهبندی میکند که معیارهای دستیابی ما را افزایش میدهد، در حالی که 500 میلیثانیه در محدوده 10 تا 30 درصد سایتها مناسبتر است. همچنین لازم به ذکر است که آستانه 200 میلیثانیه «خوب» نیز برای این سایتها سختتر است، اما با توجه به اینکه 23 درصد از سایتها هنوز این آستانه را روی تلفن همراه میگذرانند، این آستانه حداقل 10 درصد از معیارهای نرخ عبور ما را نیز پشت سر میگذارد.
به همین دلیل نتیجه می گیریم که 200 ms یک آستانه معقول "خوب" برای اکثر سایت ها است و بیشتر از 500 ms یک آستانه معقول "ضعیف" است.
تغییر چیدمان تجمعی
آستانه های CLS با کیفیت تجربه و ملاحظات دست یافتنی زیر تنظیم شدند.
کیفیت تجربه
تغییر چیدمان تجمعی (CLS) معیار جدیدی است که میزان تغییر محتوای قابل مشاهده یک صفحه را اندازه گیری می کند. با توجه به جدید بودن CLS، ما از تحقیقاتی که بتواند به طور مستقیم آستانه های این معیار را تعیین کند، آگاه نیستیم. بنابراین، برای شناسایی آستانهای که با انتظارات کاربر همسو باشد، صفحات دنیای واقعی را با مقادیر مختلف تغییر طرحبندی ارزیابی کردیم تا قبل از ایجاد اختلالات قابلتوجه هنگام مصرف محتوای صفحه، حداکثر مقدار تغییر قابل قبول را تعیین کنیم. در آزمایش داخلی ما، متوجه شدیم که سطوح تغییر از 0.15 و بالاتر به طور مداوم به عنوان اخلالکننده تلقی میشد، در حالی که تغییرات 0.1 و پایینتر قابلتوجه بود اما بیش از حد مخل نبود. بنابراین، در حالی که تغییر طرح صفر ایده آل است، به این نتیجه رسیدیم که مقادیر تا 0.1 آستانه های CLS "خوب" نامزد هستند.
دست یافتنی
بر اساس دادههای CrUX، میتوانیم ببینیم که تقریباً 50٪ از مبداها دارای CLS 0.05 یا کمتر هستند.
0.05 | 0.1 | 0.15 | |
---|---|---|---|
تلفن | 49% | 60% | 69% |
دسکتاپ | 42% | 59% | 69% |
در حالی که دادههای CrUX نشان میدهد که 0.05 ممکن است یک آستانه معقول CLS "خوب" باشد، ما تشخیص میدهیم که برخی موارد استفاده وجود دارد که در آن اجتناب از تغییرات طرحبندی مخرب دشوار است. برای مثال، برای محتوای تعبیهشده شخص ثالث، مانند جاسازیهای رسانههای اجتماعی، ارتفاع محتوای تعبیهشده گاهی اوقات تا زمانی که بارگیری تمام نشده مشخص نمیشود، که میتواند منجر به تغییر چیدمان بیشتر از 0.05 شود. بنابراین، نتیجه میگیریم که در حالی که بسیاری از مبداها آستانه 0.05 را برآورده میکنند، آستانه CLS کمی سختتر 0.1 تعادل بهتری بین کیفیت تجربه و دستیابی ایجاد میکند. امیدواریم که در آینده، اکوسیستم وب راهحلهایی را برای رسیدگی به تغییرات طرحبندی ناشی از تعبیههای شخص ثالث شناسایی کند، که امکان استفاده از آستانه سختگیرانهتر CLS "خوب" 0.05 یا 0 را در تکرار بعدی Core Web Vitals فراهم میکند. .
علاوه بر این، برای تعیین آستانه ضعیف برای CLS، از دادههای CrUX برای شناسایی آستانهای استفاده کردیم که توسط اکثر مبداها برآورده شده است:
0.15 | 0.2 | 0.25 | 0.3 | |
---|---|---|---|---|
تلفن | 31% | 25% | 20% | 18% |
دسکتاپ | 31% | 23% | 18% | 16% |
برای آستانه 0.25، تقریباً 20٪ از مبدا تلفن، و 18٪ از مبدا دسکتاپ، به عنوان "ضعیف" طبقه بندی می شوند. این در محدوده هدف ما 10-30 درصد است، بنابراین ما به این نتیجه رسیدیم که 0.25 یک آستانه قابل قبول "ضعیف" است.