လက်ရှိရက်စွဲအရ၊ Google Cloud Platform (GCP) မှ ပေးဆောင်ထားသော အပြည့်အဝစီမံခန့်ခွဲပြီး ဆာဗာမဲ့ဒေတာဂိုဒေါင်ဖြစ်သည့် BigQuery တွင် အများသူငှာဒေတာအစုံများစွာ ရရှိနိုင်ပါသည်။ BigQuery သည် SQL မေးမြန်းမှုများကို အသုံးပြု၍ ကြီးမားသောဒေတာအတွဲများကို သိမ်းဆည်းခြင်း၊ မေးမြန်းခြင်းနှင့် ခွဲခြမ်းစိတ်ဖြာခြင်းအတွက် ပလပ်ဖောင်းတစ်ခုကို ပံ့ပိုးပေးပါသည်။ ၎င်းသည် သုတေသန၊ ခွဲခြမ်းစိတ်ဖြာမှုနှင့် စက်သင်ယူမှုအပါအဝင် ရည်ရွယ်ချက်အမျိုးမျိုးအတွက် အသုံးပြုသူများ ဝင်ရောက်အသုံးပြုနိုင်ပြီး အသုံးပြုနိုင်သည့် ကျယ်ပြန့်သော အများသူငှာဒေတာအတွဲများကို ပေးဆောင်ပါသည်။
BigQuery ရှိ အများသူငှာ ဒေတာအတွဲများ ရရှိနိုင်မှုသည် ဒေတာအတွဲအသစ်များကို ပေါင်းထည့်ကာ ရှိပြီးသားအရာများကို အပ်ဒိတ်လုပ်ခြင်း သို့မဟုတ် ဖယ်ရှားခြင်းတို့ကြောင့် အဆက်မပြတ် ပြောင်းလဲနေပါသည်။ Google သည် အမျိုးမျိုးသော ဒေတာအတွဲများကို အများသူငှာရရှိနိုင်စေရန် အဖွဲ့အစည်းအသီးသီး၊ ပညာရေးဆိုင်ရာ အဖွဲ့အစည်းများနှင့် အစိုးရအေဂျင်စီများနှင့် တက်ကြွစွာ ပူးပေါင်းဆောင်ရွက်ပါသည်။ ဤဒေတာအတွဲများသည် လူမှုရေးသိပ္ပံ၊ ဇီဝဗေဒ၊ ရာသီဥတု၊ ဘဏ္ဍာရေး၊ သယ်ယူပို့ဆောင်ရေးနှင့် အခြားအရာများအပါအဝင် ကျယ်ပြန့်သောနယ်ပယ်များကို လွှမ်းခြုံထားသည်။
BigQuery ရှိ အများသူငှာ ဒေတာအတွဲများကို ဝင်ရောက်ကြည့်ရှုရန်၊ အသုံးပြုသူများသည် BigQuery ကွန်ဆိုးလ်သို့ သွားရန်၊ "အများပြည်သူဆိုင်ရာ ဒေတာအတွဲများ" ရွေးချယ်မှုကို ရွေးချယ်ပြီး ရရှိနိုင်သော ဒေတာအတွဲများကို ရှာဖွေကြည့်ရှုနိုင်ပါသည်။ တနည်းအားဖြင့် သုံးစွဲသူများသည် BigQuery command-line tool သို့မဟုတ် Google Cloud မှ ပံ့ပိုးပေးထားသော ဒေတာအတွဲများကို ပရိုဂရမ်မာကျကျ ဝင်ရောက်ကြည့်ရှုပြီး အပြန်အလှန်တုံ့ပြန်ရန်အတွက် အသုံးပြုသူများ အသုံးပြုနိုင်ပါသည်။
ဒေတာအတွဲအသစ်များကို အခါအားလျော်စွာ ထည့်သွင်းပေးသောကြောင့် BigQuery တွင်ရရှိနိုင်သော အများသူငှာဒေတာအစုံအရေအတွက်ကို ပုံသေမသတ်မှတ်ပါ။ သို့သော်၊ ဤအဖြေကိုရေးသားသည့်အချိန်မှစ၍ BigQuery တွင်ရရှိနိုင်သောအများပြည်သူဆိုင်ရာဒေတာအတွဲများထောင်ပေါင်းများစွာရှိသည်။ အချို့သော ထင်ရှားသော ဥပမာများ ပါဝင်သည်။
1. Open Images Dataset- ဤဒေတာအတွဲတွင် အမျိုးအစားအမျိုးမျိုးမှ အညွှန်းများဖြင့် အမှတ်အသားပြုထားသည့် သန်းပေါင်းများစွာသော ရုပ်ပုံများပါရှိသည်။ ၎င်းသည် ကွန်ပြူတာအမြင်ပုံစံများကို လေ့ကျင့်ခြင်းနှင့် အကဲဖြတ်ခြင်းအတွက် အဖိုးတန်အရင်းအမြစ်တစ်ခုဖြစ်သည်။
2. Global Surface Water Explorer- ဤဒေတာအတွဲသည် 1984 ခုနှစ်မှ ယနေ့အထိ ကမ္ဘာ့ရေမျက်နှာပြင်၏ အတိုင်းအတာနှင့် ဒိုင်းနမစ်ဆိုင်ရာ အချက်အလက်များကို ပေးပါသည်။ ရေရရှိနိုင်မှုကို လေ့လာခြင်း၊ ရေတွင်းပြောင်းလဲမှုများနှင့် ပတ်ဝန်းကျင်အခြေအနေများကို စောင့်ကြည့်ခြင်းအတွက် အသုံးဝင်သည်။
3. New York City Taxi နှင့် Limousine Commission (TLC) Trip Record Data- ဤဒေတာအတွဲတွင် နယူးယောက်စီးတီးရှိ တက္ကစီနှင့် အငှားယာဉ်ခရီးစဉ်များအကြောင်း အသေးစိတ်အချက်အလက်များ ပါဝင်ပါသည်။ သယ်ယူပို့ဆောင်ရေးပုံစံများကို ခွဲခြမ်းစိတ်ဖြာခြင်း၊ လမ်းကြောင်းများ ကောင်းမွန်အောင်ပြုလုပ်ခြင်းနှင့် မြို့ပြရွေ့လျားသွားလာမှုကို လေ့လာခြင်းတို့အတွက် ၎င်းကို အသုံးပြုနိုင်သည်။
4. စီးပွားရေးခွဲခြမ်းစိတ်ဖြာမှုဗျူရို (BEA) စီးပွားရေးဒေတာ- ဤဒေတာအတွဲသည် GDP၊ ကိုယ်ရေးကိုယ်တာဝင်ငွေ၊ ကုန်သွယ်မှုစာရင်းအင်းများနှင့် အခြားအရာများအပါအဝင် စီးပွားရေးဒေတာများစွာကို ဝင်ရောက်ကြည့်ရှုခွင့်ပေးပါသည်။ စီးပွားရေး သုတေသနနှင့် ခွဲခြမ်းစိတ်ဖြာမှု ပြုလုပ်ခြင်းအတွက် တန်ဖိုးရှိပါသည်။
5. NOAA Global Historical Climatology Network (GHCN)- ဤဒေတာအတွဲတွင် ကမ္ဘာတစ်ဝှမ်းရှိ ထောင်နှင့်ချီသော မိုးလေဝသဌာနများမှ သမိုင်းဝင် မိုးလေဝသ စောင့်ကြည့်မှုများ ပါရှိသည်။ ရာသီဥတု ခွဲခြမ်းစိတ်ဖြာခြင်း၊ ရာသီဥတုပုံစံ ရေးဆွဲခြင်းနှင့် ရေရှည်ရာသီဥတု လမ်းကြောင်းများကို လေ့လာခြင်းအတွက် အသုံးဝင်သည်။
ဤဥပမာများသည် BigQuery တွင်ရရှိနိုင်သော အများသူငှာဒေတာအတွဲများ၏ အစိတ်အပိုင်းတစ်ခုမျှသာဖြစ်သည်။ ပလက်ဖောင်းသည် ကွဲပြားသော သုတေသနနှင့် ခွဲခြမ်းစိတ်ဖြာမှု လိုအပ်ချက်များကို ဖြည့်ဆည်းပေးသည့် များပြားလှသော ဒေတာအစုအဝေးများကို ပံ့ပိုးပေးပါသည်။ အသုံးပြုသူများသည် ထိုးထွင်းသိမြင်မှုများရရှိရန်၊ မော်ဒယ်များတည်ဆောက်ရန်နှင့် ၎င်းတို့၏ စက်သင်ယူမှုပရောဂျက်များကို တိုးတက်စေရန်အတွက် ဤဒေတာအတွဲများကို အသုံးချနိုင်သည်။
BigQuery သည် သုတေသန၊ ခွဲခြမ်းစိတ်ဖြာမှုနှင့် စက်သင်ယူမှုအပါအဝင် ရည်ရွယ်ချက်အမျိုးမျိုးအတွက် အသုံးပြုနိုင်သည့် ကျယ်ပြန့်သော အများသူငှာဒေတာအတွဲများကို ဝင်ရောက်ကြည့်ရှုခွင့်ပေးပါသည်။ လက်ရှိရက်စွဲအရ BigQuery တွင် ရရှိနိုင်သော အများသူငှာ ဒေတာအတွဲများ ထောင်ပေါင်းများစွာ ရှိပြီး မတူကွဲပြားသော ဒိုမိန်းများကို လွှမ်းခြုံကာ လေ့လာမှုနယ်ပယ်အသီးသီးသို့ အဖိုးတန်သော ထိုးထွင်းအမြင်များကို ပေးဆောင်ပါသည်။
အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ စက်သင်ယူမှုအတွက်တိုးတက်:
- kernel တစ်ခုကို ဒေတာဖြင့် ဖောက်ထွင်းခံရပြီး မူရင်းသည် လျှို့ဝှက်ထားသည့်အခါ၊ ခြည်ခြည်မျှင်သည် အများသူငှာ ဖြစ်နိုင်ပြီး ၎င်းသည် ကိုယ်ရေးကိုယ်တာချိုးဖောက်မှုမဟုတ်ပါက၊
- စက်သင်ယူမှုတွင် ကြီးမားသောဒေတာအတွဲများနှင့် လုပ်ဆောင်ရာတွင် ကန့်သတ်ချက်များကား အဘယ်နည်း။
- စက်သင်ယူခြင်းသည် ဒိုင်ယာလော့ဂ်အကူအညီအချို့ကို ပေးနိုင်ပါသလား။
- TensorFlow ကစားကွင်းဆိုတာဘာလဲ။
- စိတ်အားထက်သန်သောမုဒ်သည် TensorFlow ၏ ဖြန့်ဝေထားသော ကွန်ပြူတာလုပ်ဆောင်နိုင်စွမ်းကို တားဆီးပါသလား။
- ML မော်ဒယ်၏ ပိုမိုထိရောက်သော လေ့ကျင့်မှုတစ်ခုအတွက် ဒေတာကြီးကြီးမားမားဖြင့် သိုလှောင်မှုမှ ကွန်ပြူတာကို ခွဲထုတ်ရန်အတွက် Google cloud ဖြေရှင်းချက်များကို အသုံးပြုနိုင်မည်လား။
- Google Cloud Machine Learning Engine (CMLE) သည် အလိုအလျောက် အရင်းအမြစ်များ ရယူခြင်းနှင့် ဖွဲ့စည်းမှုပုံစံကို ပံ့ပိုးပေးပြီး မော်ဒယ်၏ လေ့ကျင့်မှုပြီးဆုံးပြီးနောက် အရင်းအမြစ်ပိတ်ခြင်းကို ကိုင်တွယ်ဖြေရှင်းပေးပါသလား။
- ထိတ်လန့်ခြင်းမရှိဘဲ မထင်သလို ကြီးမားသော ဒေတာအတွဲများပေါ်တွင် စက်သင်ယူမှုပုံစံများကို လေ့ကျင့်ပေးနိုင်ပါသလား။
- CMLE ကိုအသုံးပြုသောအခါ၊ ဗားရှင်းတစ်ခုဖန်တီးရာတွင် ထုတ်ယူထားသောမော်ဒယ်၏အရင်းအမြစ်ကို သတ်မှတ်ရန် လိုအပ်ပါသလား။
- CMLE သည် Google Cloud သိုလှောင်မှုဒေတာမှ ဖတ်ရှုနိုင်ပြီး ကောက်ချက်ချရန်အတွက် သတ်မှတ်ထားသော လေ့ကျင့်ထားသော မော်ဒယ်ကို သုံးနိုင်ပါသလား။
Advancing in Machine Learning တွင် နောက်ထပ်မေးခွန်းများနှင့် အဖြေများကို ကြည့်ပါ။