Google आपकी पसंदीदा भाषा में कॉन्टेंट का अनुवाद करने के लिए, एआई टेक्नोलॉजी का इस्तेमाल करता है. एआई से मिले अनुवादों में गलतियां हो सकती हैं.

BigQuery पर CrUX

जानें कि BigQuery पर CrUX डेटा को कैसे व्यवस्थित किया जाता है.

परिचय

Chrome UX Report (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया गया डेटाबेस है.

BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे तौर पर पूरे डेटासेट पर क्वेरी कर सकते हैं. यह डेटासेट 2017 से उपलब्ध है. उदाहरण के लिए, रुझानों का विश्लेषण करने, वेब टेक्नोलॉजी की तुलना करने, और डोमेन की परफ़ॉर्मेंस की तुलना करने के लिए.

डेटा को हर महीने के हिसाब से व्यवस्थित किया जाता है. साथ ही, इसमें कई खास जानकारी वाली टेबल भी होती हैं, ताकि डेटा को तेज़ी से ऐक्सेस किया जा सके.

BigQuery डेटा, CrUX डैशबोर्ड का आधार होता है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना ही इस डेटा को विज़ुअलाइज़ किया जा सकता है.

डेटासेट ऐक्सेस करना

BigQuery का इस्तेमाल करने के लिए, Google Cloud खाता होना ज़रूरी है. साथ ही, आपको एसक्यूएल के बारे में बुनियादी जानकारी होनी चाहिए. BigQuery पर मौजूद CrUX डेटासेट को बिना किसी शुल्क के ऐक्सेस किया जा सकता है. साथ ही, फ़्री टियर की सीमाओं तक इसे एक्सप्लोर किया जा सकता है. यह फ़्री टियर, हर महीने रिन्यू होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे वे मुफ़्त टियर से ज़्यादा के खर्च को कवर कर सकते हैं. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड की जानकारी देना ज़रूरी है. इसके बारे में जानने के लिए, मुझे क्रेडिट कार्ड की जानकारी क्यों देनी होगी? लेख पढ़ें.

अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:

Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
अपने नए प्रोजेक्ट को "My Chrome UX Report" जैसा कोई नाम दें और 'बनाएं' पर क्लिक करें.
मांगे जाने पर, बिलिंग की जानकारी दें.
BigQuery पर CrUX डेटासेट पर जाएं

अब डेटासेट से क्वेरी की जा सकती हैं.

प्रोजेक्ट मैनेज करना

BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की जानकारी, chrome-ux-report.all में नई टेबल के तौर पर रिलीज़ की जाती है. इसके अलावा, कई मेटेरियलाइज़्ड टेबल भी हैं. इनमें हर महीने के लिए खास जानकारी वाले आंकड़े दिए जाते हैं.

`chrome-ux-report
- all
  - YYYYMM
- country_CC
  - YYYYMM
- experimental
  - country
  - global
- materialized

टेबल स्कीमा के बारे में ज़्यादा जानकारी

हर देश और all डेटासेट के लिए रॉ टेबल, साल और महीने के हिसाब से उपलब्ध कराई जाती हैं.

रॉ टेबल

रॉ टेबल का स्कीमा यहां दिया गया है:

origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
- cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
- navigate
- navigate_cache
- reload
- restore
- back_forward
- back_forward_cache
- prerender
experimental
- permission
  - notifications
- time_to_first_byte
- popularity

मटेरियलाइज़्ड टेबल का स्कीमा

मुख्य डाइमेंशन के हिसाब से, खास जानकारी वाले डेटा को आसानी से ऐक्सेस करने के लिए, मेटेरियलाइज़्ड टेबल उपलब्ध कराई जाती हैं. इसमें कोई हिस्टोग्राम नहीं दिया गया है. इसके बजाय, परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, परफ़ॉर्मेंस डेटा को फ़्रैक्शन में इकट्ठा किया जाता है. इस उदाहरण में, metrics_summary टेबल की कुछ लाइनों का उदाहरण दिखाया गया है:

yyyymm	origin	fast_lcp	avg_lcp	slow_lcp	p75_lcp
202204	https://example.com	0.9056	0.0635	0.0301	1600
202203	https://example.com	0.9209	0.052	0.0274	1400
202202	https://example.com	0.9169	0.0545	0.0284	1500
202201	https://example.com	0.9072	0.0626	0.0298	1500

इससे पता चलता है कि 202204 डेटासेट में, https://example.com पर 90.56% असल उपयोगकर्ता अनुभव, एलसीपी के अच्छे स्कोर की ज़रूरी शर्तें पूरी करते हैं. साथ ही, एलसीपी के 75वें पर्सेंटाइल की वैल्यू 1,600 मि॰से॰ थी. यह पिछले महीनों की तुलना में थोड़ा कम है.

चार मटीरियलाइज़्ड टेबल उपलब्ध कराई गई हैं:

metrics_summary: महीने और ओरिजिन के हिसाब से मुख्य मेट्रिक
device_summary: महीने, ऑरिजिन, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary: महीने, ओरिजिन, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary: डेटासेट में शामिल सभी ऑरिजिन की सूची

`metrics_summary`

metrics_summary टेबल में, हर ऑरिजिन और हर महीने के डेटासेट के लिए खास जानकारी वाले आंकड़े शामिल होते हैं:

yyyymm: डेटा इकट्ठा करने की अवधि का महीना
origin: साइट के ऑरिजिन का यूआरएल
rank: कोर्स की लोकप्रियता के हिसाब से रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls: सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
[fast|avg|slow]_<metric>: परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
[low|medium|high]_rtt: आरटीटी थ्रेशोल्ड के हिसाब से ट्रैफ़िक का फ़्रैक्शन
p75_<metric>: परफ़ॉर्मेंस मेट्रिक की 75वें पर्सेंटाइल की वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]: सूचना पाने की अनुमति से जुड़े व्यवहार का हिस्सा
[desktop|phone|tablet]Density: डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density: कनेक्शन टाइप के हिसाब से ट्रैफ़िक का फ़्रैक्शन (इसकी गिनती rtt हिस्टोग्राम से की जाती है. ये हिस्टोग्राम फ़रवरी 2025 से उपलब्ध होंगे. इसमें ऑफ़लाइन कनेक्शन शामिल नहीं है)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]: नेविगेशन टाइप का फ़्रैक्शन

`device_summary`

device_summary टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, इसमें यह भी शामिल है:

device: डिवाइस का नाप या आकार

`country_summary`

country_summary टेबल में, महीने, ओरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, इसमें यह भी शामिल है:

country_code: दो अक्षरों वाला देश का कोड
device: डिवाइस का नाप या आकार

`origin_summary`

origin_summary टेबल में, CrUX डेटासेट में मौजूद सभी ऑरिजिन की सूची होती है. यह हर महीने अपडेट होती है. इसमें डेटासेट में मौजूद ऑरिजिन की नई सूची होती है. इसमें सिर्फ़ एक कॉलम होता है: origin.

एक्सपेरिमेंट के लिए डेटासेट

एक्सपेरिमेंट वाले डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM टेबल की सटीक कॉपी होती हैं. हालांकि, इनमें BigQuery की नई और ज़्यादा बेहतर सुविधाओं का इस्तेमाल किया जाता है. जैसे, पार्टिशनिंग और क्लस्टरिंग. इनकी मदद से, कम समय में, आसानी से, और कम लागत में क्वेरी लिखी जा सकती हैं.

`country`

experimental.country डेटासेट में, country_CC डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख और country_code कॉलम जोड़े जाते हैं. इससे, हर महीने की टेबल को जोड़े बिना, समय के साथ देश के हिसाब से तुलना की जा सकती है.

`global`

experimental.global डेटासेट में, all डेटासेट से इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. इसका स्कीमा, रॉ टेबल के जैसा ही होता है. इसमें तारीख की जानकारी भी शामिल होती है. इससे, समय के साथ तुलना करने वाली क्वेरी को हर महीने की टेबल को जोड़े बिना ही चलाया जा सकता है.

BigQuery पर CrUX संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.