Pandas စာကြည့်တိုက်ကို အသုံးပြု၍ စက်သင်ယူမှုပုံစံကို လေ့ကျင့်ရန်အတွက် ကျွန်ုပ်တို့၏ဒေတာကို ပြင်ဆင်ရာတွင် အဘယ်အဆင့်များပါဝင်သနည်း။

by EITCA အကယ်ဒမီ / ဗုဒ္ဓဟူးနေ့၊ Augustဂုတ်လ ၁၉ ရက်၊ / Published in ပြည်တွင်းသတင်း ဉာဏ်ရည်တု, EITC/AI/GCML Google Cloud Machine Learning, စက်သင်ယူမှုအတွက်တိုးတက်, AutoML Vision - အပိုင်း ၁, စာမေးပွဲသုံးသပ်ချက်

စက်သင်ယူမှုနယ်ပယ်တွင်၊ မော်ဒယ်တစ်ခုကို လေ့ကျင့်မှုအောင်မြင်ရန်အတွက် ဒေတာပြင်ဆင်မှုသည် အရေးကြီးသောအခန်းကဏ္ဍမှ ပါဝင်ပါသည်။ Pandas စာကြည့်တိုက်ကို အသုံးပြုသည့်အခါ စက်သင်ယူမှုပုံစံကို လေ့ကျင့်ရန်အတွက် ဒေတာပြင်ဆင်ခြင်းတွင် အဆင့်များစွာပါဝင်ပါသည်။ ဤအဆင့်များတွင် ဒေတာဖွင့်ခြင်း၊ ဒေတာရှင်းလင်းခြင်း၊ ဒေတာအသွင်ပြောင်းခြင်းနှင့် ဒေတာခွဲခြမ်းခြင်းတို့ ပါဝင်သည်။

ဒေတာကို ပြင်ဆင်ရာတွင် ပထမအဆင့်မှာ ၎င်းကို Pandas DataFrame တွင် တင်ရန်ဖြစ်သည်။ ၎င်းကို ဖိုင်တစ်ခုမှ ဒေတာဖတ်ခြင်းဖြင့် သို့မဟုတ် ဒေတာဘေ့စ်တစ်ခုအား မေးမြန်းခြင်းဖြင့် ပြုလုပ်နိုင်သည်။ Pandas သည် ဤလုပ်ငန်းစဉ်ကို ချောမွေ့စေရန် `read_csv()`၊ `read_excel()` နှင့် `read_sql()` ကဲ့သို့သော လုပ်ဆောင်ချက်များစွာကို ပံ့ပိုးပေးပါသည်။ ဒေတာကို တင်ပြီးသည်နှင့် ၎င်းကို ဇယားဖော်မတ်ဖြင့် သိမ်းဆည်းထားကာ ကိုင်တွယ်ခွဲခြမ်းစိတ်ဖြာရန် ပိုမိုလွယ်ကူစေသည်။

နောက်တစ်ဆင့်မှာ ပျောက်ဆုံးနေသော တန်ဖိုးများကို ကိုင်တွယ်ခြင်း၊ ထပ်တူနေသော အရာများကို ဖယ်ရှားခြင်းနှင့် outliers များကို ကိုင်တွယ်ခြင်းတို့ ပါဝင်သည့် ဒေတာရှင်းလင်းခြင်း ဖြစ်သည်။ လွဲမှားနေသောတန်ဖိုးများကို ဆိုလိုခြင်း သို့မဟုတ် ရှေ့သို့/နောက်ပြန်ဖြည့်ခြင်းကဲ့သို့သော နည်းစနစ်များကို အသုံးပြု၍ ဖြည့်စွက်နိုင်ပါသည်။ `duplicated()` နှင့် `drop_duplicates()` လုပ်ဆောင်ချက်များကို အသုံးပြု၍ မိတ္တူများကို ဖော်ထုတ်နိုင်ပြီး ဖယ်ရှားနိုင်သည်။ Outliers များကို Z-score သို့မဟုတ် interquartile range (IQR) ကဲ့သို့သော ကိန်းဂဏန်းဆိုင်ရာ နည်းလမ်းများကို အသုံးပြု၍ ရှာဖွေတွေ့ရှိနိုင်ပြီး ၎င်းတို့ကို ဖယ်ရှားခြင်း သို့မဟုတ် ၎င်းတို့ကို ပိုမိုသင့်လျော်သောတန်ဖိုးအဖြစ် ပြောင်းလဲခြင်းဖြင့် ကိုင်တွယ်နိုင်သည်။

ဒေတာကို သန့်စင်ပြီးနောက် နောက်တစ်ဆင့်မှာ ဒေတာအသွင်ပြောင်းခြင်း ဖြစ်သည်။ ၎င်းတွင် အမျိုးအစားအလိုက် ကိန်းရှင်များကို ဂဏန်းကိုယ်စားပြုမှုများအဖြစ်သို့ ပြောင်းလဲခြင်း၊ ကိန်းဂဏန်းကိန်းရှင်များကို အတိုင်းအတာချဲ့ခြင်းနှင့် အင်္ဂါရပ်အသစ်များ ဖန်တီးခြင်းတို့ ပါဝင်ပါသည်။ one-hot encoding သို့မဟုတ် label encoding ကဲ့သို့သော နည်းပညာများကို အသုံးပြု၍ အမျိုးအစားကွဲကွဲပြားမှုများကို ပြောင်းလဲနိုင်သည်။ စံနှုန်းသတ်မှတ်ခြင်း သို့မဟုတ် ပုံမှန်ပြုလုပ်ခြင်းကဲ့သို့သော နည်းစနစ်များကို အသုံးပြု၍ ကိန်းဂဏန်းကိန်းရှင်များကို ချိန်ညှိနိုင်သည်။ လက်ရှိအင်္ဂါရပ်များကို ပေါင်းစပ်ခြင်းဖြင့် သို့မဟုတ် ၎င်းတို့ကို သင်္ချာဆိုင်ရာ လုပ်ဆောင်ချက်များကို အသုံးပြုခြင်းဖြင့် အင်္ဂါရပ်အသစ်များကို ဖန်တီးနိုင်သည်။

နောက်ဆုံးအနေနဲ့ ဒေတာတွေကို လေ့ကျင့်ရေးနဲ့ စမ်းသပ်မှုအစုတွေမှာ ခွဲထားဖို့ လိုပါတယ်။ မမြင်ရသော ဒေတာများတွင် လေ့ကျင့်ထားသော မော်ဒယ်၏ စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရန် ၎င်းကို လုပ်ဆောင်သည်။ Pandas ရှိ `train_test_split()` လုပ်ဆောင်ချက်ကို သတ်မှတ်ထားသော အချိုးတစ်ခုအပေါ် အခြေခံ၍ ဒေတာများကို လေ့ကျင့်ရေးနှင့် စမ်းသပ်မှုအစုများအဖြစ် ကျပန်းခွဲထုတ်ရန်အတွက် အသုံးပြုနိုင်ပါသည်။ ပစ်မှတ်ကိန်းရှင်၏ ဖြန့်ဝေမှုကို ထိန်းသိမ်းသည့်နည်းလမ်းဖြင့် ဒေတာကို ခွဲထားကြောင်း သေချာစေရန် အရေးကြီးပါသည်။

အကျဉ်းချုပ်အနေဖြင့် Pandas စာကြည့်တိုက်ကို အသုံးပြု၍ စက်သင်ယူမှုပုံစံကို လေ့ကျင့်ရန်အတွက် ဒေတာပြင်ဆင်ခြင်းတွင် ပါ၀င်သော အဆင့်များသည် ဒေတာတင်ခြင်း၊ ဒေတာရှင်းလင်းခြင်း၊ ဒေတာအသွင်ပြောင်းခြင်းနှင့် ဒေတာခွဲခြမ်းခြင်းတို့ ပါဝင်ပါသည်။ မော်ဒယ်ကို လေ့ကျင့်သင်ကြားရန်နှင့် ယုံကြည်စိတ်ချရသော ရလဒ်များရရှိရန်အတွက် ဒေတာသည် သင့်လျော်သောပုံစံတစ်ခုဖြစ်ကြောင်း သေချာစေရန်အတွက် ဤအဆင့်များသည် မရှိမဖြစ်လိုအပ်ပါသည်။

အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ စက်သင်ယူမှုအတွက်တိုးတက်:

Advancing in Machine Learning တွင် နောက်ထပ်မေးခွန်းများနှင့် အဖြေများကို ကြည့်ပါ။

နောက်ထပ်မေးခွန်းများနှင့် အဖြေများ-

field: ဉာဏ်ရည်တု
ပရိုဂရမျ: EITC/AI/GCML Google Cloud Machine Learning (လက်မှတ်အစီအစဉ်ကိုသွားပါ။)
သင်ခန်းစာကို: စက်သင်ယူမှုအတွက်တိုးတက် (သက်ဆိုင်ရာသင်ခန်းစာကို သွားပါ။)
Topic: AutoML Vision - အပိုင်း ၁ (သက်ဆိုင်ရာ အကြောင်းအရာကို သွားပါ။)
စာမေးပွဲသုံးသပ်ချက်

အောက်တွင် tag လုပ်ခဲ့သည် ဉာဏ်ရည်တု, ဒေတာများသန့်ရှင်းရေး, ဒေတာများကိုပြင်ဆင်မှု, ဒေတာပြောင်းလဲခြင်း, စက်သင်ယူ, ပန်ဒါ

EITCA အကယ်ဒမီ

အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ စက်သင်ယူမှုအတွက်တိုးတက်:

နောက်ထပ်မေးခွန်းများနှင့် အဖြေများ-

EITCA Academy သည် European IT Certification မူဘောင်၏ အစိတ်အပိုင်းတစ်ခုဖြစ်သည်။

EITCA Academy အတွက်အရည်အချင်းပြည့်မီမှု ၈၀% EITCI DSJC ထောက်ပံ့ငွေပံ့ပိုးမှု

EITCA အကယ်ဒမီ

သင်၏သုံးစွဲသူအမည်သို့မဟုတ်အီးမေးလ်လိပ်စာဖြင့်သင်၏ငွေစာရင်းသို့ဝင်ပါ

သင့်အသေးစိတ်မေ့နေပါသလား?

အကောင့်တစ်ခုဖန်တီးသည်

အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ စက်သင်ယူမှုအတွက်တိုးတက်:

နောက်ထပ်မေးခွန်းများနှင့် အဖြေများ-

EITCA Academy အတွက်အရည်အချင်းပြည့်မီမှု ၈၀% EITCI DSJC ထောက်ပံ့ငွေပံ့ပိုးမှု