जानें कि BigQuery पर CrUX डेटा को कैसे व्यवस्थित किया जाता है.
परिचय
Chrome UX Report (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया गया डेटाबेस है.
BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे तौर पर पूरे डेटासेट पर क्वेरी कर सकते हैं. यह डेटासेट 2017 से उपलब्ध है. उदाहरण के लिए, रुझानों का विश्लेषण करने, वेब टेक्नोलॉजी की तुलना करने, और डोमेन की परफ़ॉर्मेंस की तुलना करने के लिए.
डेटा को हर महीने के हिसाब से व्यवस्थित किया जाता है. साथ ही, इसमें कई खास जानकारी वाली टेबल भी होती हैं, ताकि डेटा को तेज़ी से ऐक्सेस किया जा सके.
BigQuery डेटा, CrUX डैशबोर्ड का आधार होता है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना ही इस डेटा को विज़ुअलाइज़ किया जा सकता है.
डेटासेट ऐक्सेस करना
BigQuery का इस्तेमाल करने के लिए, Google Cloud खाता होना ज़रूरी है. साथ ही, आपको एसक्यूएल के बारे में बुनियादी जानकारी होनी चाहिए. BigQuery पर मौजूद CrUX डेटासेट को बिना किसी शुल्क के ऐक्सेस किया जा सकता है. साथ ही, फ़्री टियर की सीमाओं तक इसे एक्सप्लोर किया जा सकता है. यह फ़्री टियर, हर महीने रिन्यू होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे वे मुफ़्त टियर से ज़्यादा के खर्च को कवर कर सकते हैं. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड की जानकारी देना ज़रूरी है. इसके बारे में जानने के लिए, मुझे क्रेडिट कार्ड की जानकारी क्यों देनी होगी? लेख पढ़ें.
अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:
- Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
- अपने नए प्रोजेक्ट को "My Chrome UX Report" जैसा कोई नाम दें और 'बनाएं' पर क्लिक करें.
- मांगे जाने पर, बिलिंग की जानकारी दें.
- BigQuery पर CrUX डेटासेट पर जाएं
अब डेटासेट से क्वेरी की जा सकती हैं.
प्रोजेक्ट मैनेज करना
BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की जानकारी, chrome-ux-report.all में नई टेबल के तौर पर रिलीज़ की जाती है. इसके अलावा, कई मेटेरियलाइज़्ड टेबल भी हैं. इनमें हर महीने के लिए खास जानकारी वाले आंकड़े दिए जाते हैं.
- `chrome-ux-report
टेबल स्कीमा के बारे में ज़्यादा जानकारी
हर देश और all डेटासेट के लिए रॉ टेबल, साल और महीने के हिसाब से उपलब्ध कराई जाती हैं.
रॉ टेबल
रॉ टेबल का स्कीमा यहां दिया गया है:
- origin
- effective_connection_type
- form_factor
- first_paint
- first_contentful_paint
- largest_contentful_paint
- dom_content_loaded
- onload
- layout_instability- cumulative_layout_shift
 
- interaction_to_next_paint
- round_trip_time
- navigation_types- navigate
- navigate_cache
- reload
- restore
- back_forward
- back_forward_cache
- prerender
 
- experimental- permission- notifications
 
- time_to_first_byte
- popularity
 
मटेरियलाइज़्ड टेबल का स्कीमा
मुख्य डाइमेंशन के हिसाब से, खास जानकारी वाले डेटा को आसानी से ऐक्सेस करने के लिए, मेटेरियलाइज़्ड टेबल उपलब्ध कराई जाती हैं. इसमें कोई हिस्टोग्राम नहीं दिया गया है. इसके बजाय, परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, परफ़ॉर्मेंस डेटा को फ़्रैक्शन में इकट्ठा किया जाता है. इस उदाहरण में, metrics_summary टेबल की कुछ लाइनों का उदाहरण दिखाया गया है:
| yyyymm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp | 
|---|---|---|---|---|---|
| 202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 | 
| 202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 | 
| 202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 | 
| 202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 | 
इससे पता चलता है कि 202204 डेटासेट में, https://example.com पर 90.56% असल उपयोगकर्ता अनुभव, एलसीपी के अच्छे स्कोर की ज़रूरी शर्तें पूरी करते हैं. साथ ही, एलसीपी के 75वें पर्सेंटाइल की वैल्यू 1,600 मि॰से॰ थी. यह पिछले महीनों की तुलना में थोड़ा कम है.
चार मटीरियलाइज़्ड टेबल उपलब्ध कराई गई हैं:
- metrics_summary
- महीने और ओरिजिन के हिसाब से मुख्य मेट्रिक
- device_summary
- महीने, ऑरिजिन, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
- country_summary
- महीने, ओरिजिन, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
- origin_summary
- डेटासेट में शामिल सभी ऑरिजिन की सूची
metrics_summary
metrics_summary टेबल में, हर ऑरिजिन और हर महीने के डेटासेट के लिए खास जानकारी वाले आंकड़े शामिल होते हैं:
- yyyymm
- डेटा इकट्ठा करने की अवधि का महीना
- origin
- साइट के ऑरिजिन का यूआरएल
- rank
- कोर्स की लोकप्रियता के हिसाब से रैंकिंग (मार्च 2021 तक)
- [small|medium|large]_cls
- सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
- [fast|avg|slow]_<metric>
- परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
- [low|medium|high]_rtt
- आरटीटी थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
- p75_<metric>
- परफ़ॉर्मेंस मेट्रिक की 75वें पर्सेंटाइल की वैल्यू (मिलीसेकंड)
- notification_permission_[accept|deny|ignore|dismiss]
- सूचना पाने की अनुमति से जुड़े व्यवहार का हिस्सा
- [desktop|phone|tablet]Density
- डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
- [_4G|_3G|_2G|slow2G|offline]Density
- कनेक्शन टाइप के हिसाब से ट्रैफ़िक का फ़्रैक्शन (इसकी गिनती rttहिस्टोग्राम से की जाती है. ये हिस्टोग्राम फ़रवरी 2025 से उपलब्ध होंगे. इसमें ऑफ़लाइन कनेक्शन शामिल नहीं है)
- navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- नेविगेशन टाइप का फ़्रैक्शन
device_summary
device_summary टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, इसमें यह भी शामिल है:
- device
- डिवाइस का नाप या आकार
country_summary
country_summary टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, इसमें यह भी शामिल है:
- country_code
- दो अक्षरों वाला देश का कोड
- device
- डिवाइस का नाप या आकार
origin_summary
origin_summary टेबल में, CrUX डेटासेट में मौजूद सभी ऑरिजिन की सूची होती है. यह हर महीने अपडेट होती है. इसमें डेटासेट में मौजूद ऑरिजिन की नई सूची होती है. इसमें सिर्फ़ एक कॉलम होता है: origin.
एक्सपेरिमेंट के लिए डेटासेट
एक्सपेरिमेंट वाले डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM टेबल की सटीक कॉपी होती हैं. हालांकि, इनमें BigQuery की नई और ज़्यादा बेहतर सुविधाओं का इस्तेमाल किया जाता है. जैसे, पार्टिशनिंग और क्लस्टरिंग. इनकी मदद से, कम समय में, आसानी से, और कम लागत में क्वेरी लिखी जा सकती हैं.
country
experimental.country डेटासेट में, country_CC डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख और country_code कॉलम जोड़े जाते हैं. इससे, हर महीने की टेबल को जोड़े बिना, समय के साथ देश के हिसाब से तुलना की जा सकती है.
global
experimental.global डेटासेट में, all डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. इसका स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख की जानकारी भी शामिल होती है. इससे, समय के साथ तुलना करने वाली क्वेरी को हर महीने की टेबल को जोड़े बिना ही चलाया जा सकता है.