כאן מוסבר איך נתוני CrUX מובנים ב-BigQuery.
מבוא
הנתונים הגולמיים שמאחורי דוח חוויית המשתמש ב-Chrome  (CrUX) זמינים ב-BigQuery, מסד נתונים שמארח ב-Google Cloud.
CrUX ב-BigQuery מאפשר למשתמשים לשלוח שאילתות ישירות למערך הנתונים המלא משנת 2017, למשל כדי לנתח מגמות, להשוות בין טכנולוגיות אינטרנט ולבצע השוואה בין דומיינים.
הנתונים מובְנים לפי מהדורות חודשיות, ויש גם מספר טבלאות סיכום שמאפשרות גישה מהירה יותר לנתונים לצורך שאילתות.
נתוני BigQuery הם הבסיס ללוח הבקרה של CrUX, שמאפשר לכם להמחיש את הנתונים האלה בלי לכתוב שאילתות SQL.
גישה למערך הנתונים
כדי להשתמש ב-BigQuery, צריך חשבון Google Cloud וידע בסיסי ב-SQL. הגישה למערך הנתונים של CrUX ב-BigQuery היא בחינם, ואפשר לעיין בו עד למגבלות של התוכנית ללא תשלום, שמתחדשת מדי חודש ומסופקת על ידי BigQuery. בנוסף, משתמשים חדשים ב-Google Cloud עשויים להיות זכאים לקרדיט על הרשמה לכיסוי הוצאות מעבר לשימוש ברמה החינמית. שימו לב: צריך לספק כרטיס אשראי לפרויקט ב-Google Cloud. למידע נוסף, אפשר לעיין במאמר למה צריך לספק כרטיס אשראי?.
אם זו הפעם הראשונה שאתם משתמשים ב-BigQuery, אתם צריכים לבצע את השלבים הבאים כדי להגדיר פרויקט:
- עוברים אל Create a Project (יצירת פרויקט) במסוף Google Cloud.
- נותנים לפרויקט החדש שם כמו My Chrome UX Report (דוח חוויית המשתמש ב-Chrome) ולוחצים על Create (יצירה).
- אם מוצגת בקשה, מציינים את פרטי החיוב.
- מעבר אל מערך הנתונים של CrUX ב-BigQuery
עכשיו אפשר להתחיל להריץ שאילתות במערך הנתונים.
ארגון פרויקטים
נתוני CrUX ב-BigQuery מתפרסמים ביום שלישי השני של החודש הבא. כל חודש מתפרסמת טבלה חדשה בקטע chrome-ux-report.all. יש גם מספר טבלאות מגובות שמספקות נתונים סטטיסטיים מסכמים לכל חודש.
- `chrome-ux-report
סכימת טבלה מפורטת
הטבלאות הגולמיות לכל מדינה ולמערך הנתונים all מסופקות לפי שנה וחודש.
טבלאות גולמיות
הסכימה של הטבלאות הגולמיות היא כדלקמן:
- origin
- effective_connection_type
- form_factor
- first_paint
- first_contentful_paint
- largest_contentful_paint
- dom_content_loaded
- onload
- layout_instability- cumulative_layout_shift
 
- interaction_to_next_paint
- round_trip_time
- navigation_types- navigate
- navigate_cache
- reload
- restore
- back_forward
- back_forward_cache
- prerender
 
- experimental- permission- notifications
 
- time_to_first_byte
- popularity
 
סכימת טבלאות מהותיות
טבלאות מגובות מספקות גישה קלה יותר לנתוני סיכום לפי מספר מאפיינים מרכזיים. לא מוצגים היסטוגרמות, אלא נתוני הביצועים מצטברים לשברים לפי הערכת הביצועים וערך האחוזון ה-75. בדוגמה הזו מוצגת קבוצה של שורות לדוגמה מהטבלה metrics_summary:
| yyyymm | מקור | fast_lcp | avg_lcp | slow_lcp | p75_lcp | 
|---|---|---|---|---|---|
| 202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 | 
| 202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1,400 | 
| 202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 | 
| 202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 | 
הנתון הזה מראה שבמערך הנתונים 202204,  90.56% מהחוויות של משתמשים אמיתיים באתר https://example.com עמדו בקריטריונים ל-LCP טוב, ושהערך המשוער של LCP באחוזון ה-75 היה 1,600ms. המהירות הזו קצת יותר נמוכה בהשוואה לחודשים הקודמים.
יש ארבע טבלאות חומרי גלם:
- metrics_summary
- מדדים מרכזיים לפי חודש ומקור
- device_summary
- מדדים מרכזיים לפי חודש, מקור וסוג מכשיר
- country_summary
- מדדים מרכזיים לפי חודש, מקור, סוג מכשיר ומדינה
- origin_summary
- רשימה של כל המקורות שנכללים במערך הנתונים
metrics_summary
הטבלה metrics_summary מכילה נתונים סטטיסטיים מסכמים לכל מקור ולכל מערך נתונים חודשי:
- yyyymm
- החודש של תקופת איסוף הנתונים
- origin
- כתובת ה-URL של מקור האתר
- rank
- דירוג פופולריות כללי (נכון למרץ 2021)
- [small|medium|large]_cls
- חלקיק התנועה לפי ספי CLS
- [fast|avg|slow]_<metric>
- חלק מהתנועה לפי ספי ביצועים
- [low|medium|high]_rtt
- חלקיק התנועה לפי ספי RTT
- p75_<metric>
- ערך האחוזון ה-75 של מדדי הביצועים (אלפיות שנייה)
- notification_permission_[accept|deny|ignore|dismiss]
- fraction of notification permission behaviors
- [desktop|phone|tablet]Density
- חלק מהתנועה לפי גורם צורה
- [_4G|_3G|_2G|slow2G|offline]Density
- חלק מהתנועה לפי סוג החיבור בפועל (מחושב מrttהיסטוגרמות מפברואר 2025, ללא נתונים אופליין)
- navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- fraction of navigation types
device_summary
הטבלה device_summary מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary, יש:
- device
- גורם הצורה של המכשיר
country_summary
הטבלה country_summary מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary, יש:
- country_code
- קוד מדינה של שתי אותיות
- device
- גורם הצורה של המכשיר
origin_summary
הטבלה origin_summary מכילה רשימה של כל המקורות במערך הנתונים של CrUX. היא מתעדכנת מדי חודש עם הרשימה העדכנית של המקורות במערך הנתונים, ויש בה עמודה אחת: origin_summary.origin
מערך נתונים ניסיוני
הטבלאות במערך הנתונים הניסיוני הן עותקים מדויקים של טבלאות ברירת המחדל YYYYMM, אבל הן משתמשות בתכונות חדשות ומתקדמות יותר של BigQuery, כמו חלוקה למחיצות ואשכולות, שמאפשרות לכתוב שאילתות מהירות, פשוטות וזולות יותר.
country
מערך הנתונים experimental.country מכיל נתונים מצטברים ממערכי הנתונים country_CC, עם עמודה נוספת yyyymm לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם תוספת של העמודות date ו-country_code. כך אפשר להריץ שאילתות להשוואה ברמת המדינה לאורך זמן בלי לבצע הצטרפות לטבלאות החודשיות.
global
מערך הנתונים experimental.global מכיל נתונים מצטברים ממערך הנתונים all עם עמודה נוספת yyyymm לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם תוספת של התאריך. כך אפשר להריץ שאילתות להשוואה לאורך זמן בלי לבצע איחוד של הטבלאות החודשיות.