စက်သင်ယူမှု၏အခြေအနေတွင် ကြီးကြီးကျယ်ကျယ်ပြုလုပ်ခြင်းသည် မော်ဒယ်များ၏ ယေဘုယျလုပ်ဆောင်နိုင်စွမ်းကို မြှင့်တင်ရန်အတွက် အထူးသဖြင့် မြင့်မားသောအဖက်ဖက်မှ ဒေတာ သို့မဟုတ် အံဝင်ခွင်ကျဖြစ်နိုင်သော ရှုပ်ထွေးသောမော်ဒယ်များနှင့် ဆက်ဆံရာတွင် အသုံးပြုသည့် အရေးကြီးသောနည်းစနစ်တစ်ခုဖြစ်သည်။ မော်ဒယ်တစ်ခုသည် လေ့ကျင့်ရေးဒေတာရှိ အရင်းခံပုံစံများကိုသာမက မမြင်ရသောဒေတာများတွင် စွမ်းဆောင်ရည် ညံ့ဖျင်းစေသည့် ဆူညံသံများကိုလည်း သင်ယူသည့်အခါ Overfitting ဖြစ်ပေါ်လာသည်။ ရှုပ်ထွေးလွန်းသော မော်ဒယ်များကို အပြစ်ပေးခြင်းဖြင့် အလွန်အကျွံ အံဝင်ခွင်ကျမဖြစ်စေရန် မိုဒယ်တစ်ခုသို့ အပိုဆောင်းအချက်အလက်များ သို့မဟုတ် ကန့်သတ်ချက်များကို မှန်မှန်ပြုလုပ်ပေးပါသည်။
ပုံမှန်ပြုလုပ်ခြင်း၏ နောက်ကွယ်တွင် အခြေခံကျသော အယူအဆမှာ ပုံစံငယ်ကို လျှော့ချရန် ကြိုးစားနေသည့် ဆုံးရှုံးမှုလုပ်ဆောင်ချက်တွင် ပြစ်ဒဏ်ကာလကို ထည့်သွင်းရန်ဖြစ်သည်။ ဤပြစ်ဒဏ်အသုံးအနှုန်းသည် ပုံမှန်အားဖြင့် မော်ဒယ်ကန့်သတ်ချက်များ၏ ပြင်းအားဖြင့်တိုင်းတာသော ရှုပ်ထွေးမှုအပေါ် ကုန်ကျစရိတ်တစ်ခုချမှတ်ခြင်းဖြင့် လေ့ကျင့်ရေးဒေတာတွင် ဆူညံသံကို အံဝင်ခွင်ကျဖြစ်အောင် မော်ဒယ်အား တားဆီးပေးသည်။ ထိုသို့ပြုလုပ်ခြင်းဖြင့်၊ ပုံမှန်ပြုလုပ်ခြင်းသည် လေ့ကျင့်ရေးဒေတာကို ကောင်းစွာအံဝင်ခွင်ကျဖြစ်စေရန်နှင့် ဒေတာအသစ်အတွက် ယေဘုယျလုပ်ဆောင်နိုင်စွမ်းကို ထိန်းသိမ်းထားနိုင်မှုကြား ဟန်ချက်ညီစေရန် ကူညီပေးပါသည်။
စက်သင်ယူမှုတွင် အသုံးများသော ပုံမှန်ပြုလုပ်ခြင်းနည်းပညာ အမျိုးအစားများစွာရှိပြီး အတွေ့ရများဆုံးမှာ L1 ပုံမှန်ပြုလုပ်ခြင်း၊ L2 ပုံမှန်ပြုလုပ်ခြင်းနှင့် ကျောင်းထွက်ခြင်းတို့ဖြစ်သည်။ ဤနည်းပညာတစ်ခုစီတွင် ၎င်း၏ကိုယ်ပိုင်လက္ခဏာများနှင့် အသုံးချမှုများရှိသည်။
1. L1 ပုံမှန်သတ်မှတ်ခြင်း (Lasso ဆုတ်ယုတ်မှု)- L1 ပုံမှန်ပြုလုပ်ခြင်းသည် ဆုံးရှုံးမှုလုပ်ဆောင်မှုတွင် ကိန်းဂဏန်းများ၏ ပကတိကိန်းဂဏန်းများ၏ ပကတိတန်ဖိုးနှင့်ညီမျှသော ပြစ်ဒဏ်ကို ပေါင်းထည့်သည်။ သင်္ချာအားဖြင့်၊ ၎င်းကို ကိုယ်စားပြုနိုင်သည်-
ဘယ်မှာ မူရင်း loss function ၊
ပုံမှန်ပြုလုပ်ခြင်း သတ်မှတ်ချက် နှင့်
မော်ဒယ်ဘောင်များ။ L1 ပုံမှန်ပြုလုပ်ခြင်း၏ အကျိုးသက်ရောက်မှုမှာ ၎င်းသည် အချို့သော coefficients များကို သုညအထိ မောင်းနှင်နိုင်ပြီး အင်္ဂါရပ်ရွေးချယ်မှုအား ထိထိရောက်ရောက် လုပ်ဆောင်နိုင်သောကြောင့် ကျဲပါးသော မော်ဒယ်များကို ထုတ်လုပ်လေ့ရှိသည်။ အင်္ဂါရပ်များစွာနှင့် မသက်ဆိုင်နိုင်သော မြင့်မားသော ဘက်မြင်ဒေတာနှင့် ကိုင်တွယ်ရာတွင် ၎င်းသည် အထူးအသုံးဝင်ပါသည်။
2. L2 ပုံမှန်သတ်မှတ်ခြင်း (Ridge Regression): L2 ပုံမှန်ပြုလုပ်ခြင်းသည် ဆုံးရှုံးမှုလုပ်ဆောင်မှုတွင် မက်သာဖိုးကိန်းများ၏ ပြင်းအား၏နှစ်ထပ်နှင့်ညီမျှသော ပြစ်ဒဏ်ကို ပေါင်းထည့်သည်။ ၎င်းကို သင်္ချာနည်းဖြင့် ဖော်ပြသည်-
L2 ပုံမှန်ပြုလုပ်ခြင်းသည် ၎င်းတို့၏ နှစ်ထပ်ကိန်းတန်ဖိုးများကို ဒဏ်ခတ်ခြင်းဖြင့် ကြီးမားသော coefficients များကို တွန်းလှန်စေပြီး အလေးများကို ပိုမိုအညီအမျှခွဲဝေပေးပါသည်။ L1 နှင့်မတူဘဲ၊ L2 ပုံမှန်ပြုလုပ်ခြင်းသည် ကိန်းများကို အတိအကျ သုညဖြစ်စေရန် တွန်းအားပေးခြင်းမရှိသောကြောင့် ကျဲသောမော်ဒယ်များကို မထုတ်လုပ်နိုင်ဘဲ ၎င်းတို့ကို သေးငယ်စေသည်။ အင်္ဂါရပ်အားလုံးတွင် ဆက်စပ်မှုအချို့ရှိသောအခါ အလွန်အကျွံမဖြစ်အောင် ရှောင်ရှားရန်အတွက် ၎င်းသည် အထူးအသုံးဝင်သည်။
3. Elastic Net Regularization: Elastic Net သည် L1 နှင့် L2 ပုံမှန်ပြုလုပ်ခြင်းကို ပေါင်းစပ်ထားသည်။ ဆက်စပ်အင်္ဂါရပ်များစွာရှိသည့် အခြေအနေများတွင် ၎င်းသည် အထူးအသုံးဝင်သည်။ Elastic Net ပြစ်ဒဏ်သည် L1 နှင့် L2 ပြစ်ဒဏ်များ၏ တစ်ပြေးညီ ပေါင်းစပ်မှုဖြစ်သည်-
ဘောင်များကို ချိန်ညှိခြင်းဖြင့် နှင့်
Elastic Net သည် L1 နှင့် L2 ပုံမှန်ပြုလုပ်ခြင်း၏ အကျိုးကျေးဇူးများကို ဟန်ချက်ညီစေနိုင်သည်။
4. နှုတ်ထွက်သည်: ကျောင်းထွက်ခြင်းသည် အာရုံကြောကွန်ရက်များအတွက် အထူးပြုလုပ်ထားသော ပုံမှန်လုပ်ဆောင်မှုနည်းလမ်းတစ်ခုဖြစ်သည်။ လေ့ကျင့်ရေးကာလအတွင်း၊ ကျောင်းထွက်ခြင်းသည် အလွှာတစ်ခုတွင် node (နျူရွန်) အပိုင်းတစ်ပိုင်းကို အထပ်ထပ်တစ်ခုစီတွင် သုညအဖြစ် သတ်မှတ်သည်။ ၎င်းသည် ကွန်ရက်အား မည်သည့် node တစ်ခုတည်းပေါ်တွင်မဆို အလွန်အမင်း အားကိုးခြင်းမှ တားဆီးကာ ပိုမိုခိုင်မာသော အင်္ဂါရပ်များကို လေ့လာရန် ကွန်ရက်အား အားပေးပါသည်။ ကျောင်းထွက်ခြင်းသည် ကန့်သတ်ချက်များ အများအပြားကြောင့် အလွန်အကျွံ အံဝင်ခွင်ကျဖြစ်နေသော နက်နဲသော သင်ယူမှုပုံစံများတွင် အထူးသဖြင့် ထိရောက်မှုရှိပါသည်။
5. စောစီးစွာ ရပ်တန့်ခြင်း- သမားရိုးကျသဘောအရ ပုံမှန်ပြုလုပ်ခြင်းနည်းပညာမဟုတ်သော်လည်း၊ စောစီးစွာရပ်တန့်ခြင်းသည် တရားဝင်သတ်မှတ်မှုတစ်ခုတွင် စွမ်းဆောင်ရည်ကျဆင်းလာသည်နှင့်တစ်ပြိုင်နက် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်ကို ရပ်တန့်ခြင်းဖြင့် အလွန်အကျွံမဖြစ်အောင် ကာကွယ်ရန် ဗျူဟာတစ်ခုဖြစ်သည်။ ၎င်းသည် မော်ဒယ်ကို အဆက်မပြတ် မွမ်းမံနေသည့် gradient descent ကဲ့သို့ ထပ်ခါထပ်ခါ နည်းလမ်းများတွင် အထူးအသုံးဝင်ပါသည်။
မော်ဒယ်များကို ၎င်းတို့၏ ရှုပ်ထွေးမှုများကို ထိန်းချုပ်ခြင်းဖြင့် မမြင်ရသော ဒေတာများကို ကောင်းမွန်စွာ လုပ်ဆောင်နိုင်စေသောကြောင့် စက်သင်ယူမှုတွင် ပုံမှန်ပြုလုပ်ရန် အရေးကြီးပါသည်။ ပုံမှန်ပြုလုပ်ခြင်းနည်းပညာ၏ရွေးချယ်မှုနှင့်၎င်း၏ parameters များကိုညှိခြင်း ( L1 နှင့် L2 အတွက် ကျောင်းထွက်နှုန်း) သည် အရေးကြီးပြီး အကောင်းဆုံးရလဒ်များရရှိရန် လက်တွေ့စမ်းသပ်မှုများနှင့် အပြန်အလှန်အတည်ပြုချက် လိုအပ်ပါသည်။
ဥပမာအားဖြင့်၊ အင်္ဂါရပ်များစွာရှိသော dataset တစ်ခုပေါ်တွင်လေ့ကျင့်ထားသော linear regression model ကိုစဉ်းစားပါ။ ပုံမှန်ပြုလုပ်ခြင်းမရှိပါက၊ မော်ဒယ်သည် အချို့သောအင်္ဂါရပ်များတွင် ကြီးမားသောအလေးချိန်များကို သတ်မှတ်ပေးကာ လေ့ကျင့်ရေးဒေတာကို အလွန်နီးကပ်စွာလိုက်ဖက်မှုရှိသော်လည်း အံကိုက်လွန်ကဲခြင်းကြောင့် စမ်းသပ်ဒေတာတွင် ညံ့ဖျင်းစွာလုပ်ဆောင်နိုင်မည်ဖြစ်သည်။ L2 ပုံမှန်ပြုလုပ်ခြင်းကို အသုံးပြုခြင်းဖြင့်၊ မော်ဒယ်သည် အလေးချိန်များကို ပိုမိုအညီအမျှ ဖြန့်ဝေရန် တွန်းအားပေးပြီး ဒေတာအသစ်များအပေါ် ပိုမိုကောင်းမွန်သော ယေဘူယျအဖြစ်သို့ ပို့ဆောင်နိုင်မည်ဖြစ်သည်။
အခြားအခြေအနေတွင်၊ ရုပ်ပုံဒေတာအတွက် လေ့ကျင့်ထားသော အာရုံကြောကွန်ရက်တစ်ခုသည် လေ့ကျင့်ရေးပုံရိပ်များရှိ တိကျသောပုံစံများကို ကျက်မှတ်ခြင်းဖြင့် လွန်သွားနိုင်သည်။ ကျောင်းထွက်ခြင်းကို လျှောက်ထားခြင်းဖြင့်၊ ကွန်ရက်သည် မမြင်ရသော ဒေတာများတွင် ၎င်း၏စွမ်းဆောင်ရည်ကို မြှင့်တင်ပေးကာ မတူညီသောပုံများတွင် အသုံးဝင်သည့် ယေဘုယျလုပ်ဆောင်ချက်များကို ပိုမိုလေ့လာရန် စေခိုင်းပါသည်။
Regularization သည် မော်ဒယ်၏ ဆုံးရှုံးမှုလုပ်ဆောင်မှုတွင် ရှုပ်ထွေးမှုအတွက် ပြစ်ဒဏ်ကို ထည့်သွင်းခြင်းဖြင့် အလွန်အကျွံ အံဝင်ခွင်ကျမဖြစ်စေရန် ကူညီပေးသည့် စက်သင်ယူမှုတွင် အခြေခံသဘောတရားတစ်ခုဖြစ်သည်။ မော်ဒယ်၏ ရှုပ်ထွေးမှုကို ထိန်းချုပ်ခြင်းဖြင့်၊ L1၊ L2၊ Elastic Net၊ ကျောင်းထွက်ခြင်းနှင့် စောစီးစွာ ရပ်တန့်ခြင်းကဲ့သို့သော ပုံမှန်ပြုလုပ်ခြင်းနည်းပညာများသည် ဒေတာအသစ်များအတွက် ပိုမိုကောင်းမွန်သော ယေဘုယျအသွင်ကူးပြောင်းမှုကို ဖြစ်ပေါ်စေပြီး ၎င်းတို့ကို စက်သင်ယူမှုလေ့ကျင့်သူ၏ ကိရိယာအစုံတွင် မရှိမဖြစ်လိုအပ်သော ကိရိယာများဖြစ်စေသည်။
အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ EITC/AI/GCML Google Cloud Machine Learning:
- machine learning တွင်အသုံးပြုသော hyperparameter များသည် အဘယ်နည်း။
- Whawt သည် စက်သင်ယူခြင်းအတွက် ပရိုဂရမ်းမင်း၏ဘာသာစကားဖြစ်ပြီး၊ ၎င်းသည် Just Python ဖြစ်သည်။
- စက်သင်ယူခြင်းအား သိပ္ပံလောကတွင် မည်သို့အသုံးချသနည်း။
- မည်သည့် machine learning algorithm ကိုအသုံးပြုရမည်ကို သင်မည်သို့ဆုံးဖြတ်ပြီး ၎င်းကို သင်မည်ကဲ့သို့ရှာဖွေမည်နည်း။
- Federated Learning၊ Edge Computing နှင့် On-Device Machine Learning အကြား ကွာခြားချက်များကား အဘယ်နည်း။
- သင်တန်းမစခင် Data တွေကို ဘယ်လိုပြင်ဆင်ပြီး သန့်ရှင်းရေးလုပ်ရမလဲ။
- စက်သင်ယူမှုပရောဂျက်တစ်ခုတွင် သီးခြား ကနဦးလုပ်ဆောင်စရာများနှင့် လုပ်ဆောင်ချက်များကား အဘယ်နည်း။
- တိကျသောစက်သင်ယူမှုဗျူဟာနှင့် မော်ဒယ်ကို လက်ခံကျင့်သုံးရန်အတွက် လက်မ၏စည်းမျဉ်းများသည် အဘယ်နည်း။
- မျဉ်းနမူနာပုံစံမှ နက်နဲသောသင်ယူမှုသို့ ပြောင်းရန် အချိန်တန်ပြီဖြစ်ကြောင်း မည်သည့်ဘောင်များက ညွှန်ပြသနည်း။
- TF ဖြန့်ဝေမှုများ မရရှိနိုင်သော ပြဿနာများကို ရှောင်ရှားရန် TensorFlow ကို ထည့်သွင်းရန်အတွက် Python ၏ မည်သည့်ဗားရှင်းသည် အကောင်းဆုံးဖြစ်မည်နည်း။
EITC/AI/GCML Google Cloud Machine Learning တွင် နောက်ထပ်မေးခွန်းများနှင့် အဖြေများကို ကြည့်ပါ။
နောက်ထပ်မေးခွန်းများနှင့် အဖြေများ-
- field: ဉာဏ်ရည်တု
- ပရိုဂရမျ: EITC/AI/GCML Google Cloud Machine Learning (လက်မှတ်အစီအစဉ်ကိုသွားပါ။)
- သင်ခန်းစာကို: စက်သင်ကြားရေးပထမအဆင့် (သက်ဆိုင်ရာသင်ခန်းစာကို သွားပါ။)
- Topic: စက်သင်ကြားမှုအဆင့် ၇ ဆင့် (သက်ဆိုင်ရာ အကြောင်းအရာကို သွားပါ။)