ကန့်သတ်ချက် ပံ့ပိုးမှု Vector Machines (SVMs) ၏ ပိုမိုကောင်းမွန်အောင်လုပ်ဆောင်ခြင်းလုပ်ငန်းစဉ်တွင် အခြေခံအစိတ်အပိုင်းတစ်ခုဖြစ်သည့် စက်သင်ယူခြင်းနယ်ပယ်တွင် ရေပန်းစားပြီး အစွမ်းထက်သောနည်းလမ်းဖြစ်သည်။ ဤကန့်သတ်ချက်သည် မတူညီသောအတန်းများကြားရှိအနားသတ်များကို တိုးမြှင့်စေပြီး SVM မော်ဒယ်သည် လေ့ကျင့်ရေးဒေတာအမှတ်များကို မှန်ကန်စွာ အမျိုးအစားခွဲကြောင်း သေချာစေရန်အတွက် အရေးကြီးသောအခန်းကဏ္ဍမှ ပါဝင်ပါသည်။ ဤကန့်သတ်ချက်၏ အရေးပါမှုကို အပြည့်အဝသဘောပေါက်ရန်၊ SVM ၏ စက်ပြင်များ၊ ကန့်သတ်ချက်၏ ဂျီဩမေတြီဆိုင်ရာ အဓိပ္ပာယ်ဖွင့်ဆိုချက်နှင့် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာအတွက် ၎င်း၏သက်ရောက်မှုများကို ထည့်သွင်းစဉ်းစားရန် အရေးကြီးပါသည်။
ပံ့ပိုးမှု Vector Machines သည် မတူညီသောအတန်းများ၏ ဒေတာမှတ်များကို အများဆုံးအနားသတ်ဖြင့် ပိုင်းခြားထားသော အကောင်းဆုံး hyperplane ကိုရှာဖွေရန် ရည်ရွယ်သည်။ n-dimensional space ရှိ ဟိုက်ပါလေယာဉ်ကို ညီမျှခြင်းဖြင့် သတ်မှတ်သည်။ အဘယ်မှာရှိသနည်း
hyperplane ၏ အလေးချိန် vector သည် ပုံမှန်ဖြစ်သည်၊
input feature vector နှင့်
ဘက်လိုက်သောအသုံးအနှုန်းဖြစ်သည်။ ရည်ရွယ်ချက်မှာ အတန်းတစ်ခုမှ အမှတ်များသည် ဟိုက်ပါပျံ၏ တစ်ဖက်ခြမ်းတွင် ရှိနေသည့် ဒေတာအချက်များ နှင့် အခြားအတန်းမှ အမှတ်များသည် ဆန့်ကျင်ဘက်ဘက်တွင် ရှိနေသော ဒေတာအမှတ်များကို ခွဲခြားရန်ဖြစ်သည်။
ကန့်သတ်ချက် data point တစ်ခုစီကို သေချာစေတယ်။
မှန်ကန်စွာ ခွဲခြားထားပြီး အနားသတ်၏ ညာဘက်ခြမ်းတွင် တည်ရှိသည်။ ဒီမှာ,
i-th data point ၏ class label ကို ကိုယ်စားပြုသည်။
အတန်းတစ်ခုအတွက်နှင့်
အခြားအတန်းအတွက်။ ဝေါဟာရ
ဟိုက်ပါယာဉ်ပျံနှင့် သက်ဆိုင်သည့် ဒေတာအမှတ်၏ တည်နေရာကို ဆုံးဖြတ်သည့် ဆုံးဖြတ်ချက် လုပ်ဆောင်ချက် ဖြစ်သည်။
ဂျီဩမေတြီ အဓိပ္ပာယ်ဖွင့်ဆိုချက်ကို နားလည်ရန် အောက်ပါတို့ကို သုံးသပ်ပါ။
1. အပြုသဘောနှင့် အနုတ်လက္ခဏာ လူတန်းစားခွဲခြားခြင်း။: အချက်တစ်ခုအတွက် အပြုသဘော အတန်းပိုင် (
) ကန့်သတ်ချက်
ရိုးရှင်းစေသည်။
. ဆိုလိုတာက data point ပါ။
သတ်မှတ်ထားသောအနားသတ်နယ်နိမိတ်ပေါ်တွင် သို့မဟုတ် အပြင်ဘက်တွင် အိပ်ရမည်။
. ထို့အတူ ဒေတာအချက်တစ်ခုအတွက်
အနုတ်လက္ခဏာအတန်းပိုင် (
) ကန့်သတ်ချက်သည် ရိုးရှင်းပါသည်။
ဒေတာအမှတ်သည် သတ်မှတ်ထားသောအနားသတ်နယ်နိမိတ်ပေါ်တွင် သို့မဟုတ် အပြင်ဘက်တွင် ရှိနေကြောင်း သေချာပါစေ။
.
2. Margin Maximization− အနားသတ်သည် အတန်းအစားတစ်ခုမှ ဟိုက်ပါယာဉ်ပျံနှင့် အနီးစပ်ဆုံးဒေတာအချက်များကြား အကွာအဝေးဖြစ်သည်။ ကန့်သတ်ချက်များသည် မှန်ကန်သော အမျိုးအစားခွဲခြားမှုကို ဆက်လက်ထိန်းသိမ်းထားစဉ်တွင် မှန်ကန်သော အမျိုးအစားခွဲခြင်းကို ဆက်လက်ထိန်းသိမ်းထားစဉ် ဒေတာအမှတ်များကို ဟိုက်ပါပျံနှင့် ဝေးနိုင်သမျှဝေးဝေးသို့ တွန်းပို့ခြင်းဖြင့် အနားသတ်များကို အမြင့်ဆုံးဖြစ်အောင် ချဲ့ထွင်ထားကြောင်း သေချာစေပါသည်။ အမှတ်တစ်ခုမှ အကွာအဝေး hyperplane က ပေးထားတာပါ။
. ကန့်သတ်ချက်များကို လိုက်နာခြင်းဖြင့်
SVM algorithm သည် ဤအကွာအဝေးကို ထိထိရောက်ရောက် ချဲ့ထွင်ပြီး ပိုကြီးသောအနားသတ်နှင့် ပိုမိုကောင်းမွန်သော အထွေထွေလုပ်ဆောင်နိုင်စွမ်းကို ဖြစ်ပေါ်စေသည်။
3. ပံ့ပိုးမှု Vectors: အနားသတ်မျဉ်းများပေါ်တွင် အတိအကျဖော်ပြထားသော ဒေတာအချက်များ နှင့်
support vectors လို့ ခေါ်ပါတယ်။ အဆိုပါအချက်များသည် ဟိုက်ပါလေယာဉ်နှင့် အနီးစပ်ဆုံးဖြစ်ပြီး ၎င်း၏အနေအထားနှင့် တိမ်းညွှတ်မှုကို တိုက်ရိုက်လွှမ်းမိုးနိုင်သောကြောင့် အကောင်းမွန်ဆုံးသော ဟိုက်ပါလေယာဉ်ကို သတ်မှတ်ရာတွင် အရေးကြီးပါသည်။ ကန့်သတ်ချက်များသည် ဤပံ့ပိုးမှု vector များကို မှန်ကန်စွာ ခွဲခြားထားပြီး အနားသတ်နယ်နိမိတ်များပေါ်တွင် ရှိနေကြောင်း သေချာစေကာ၊ ထို့ကြောင့် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာတွင် အဓိကအခန်းကဏ္ဍမှ ပါဝင်ပါသည်။
SVM များအတွက် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာကို အလေးချိန် vector ၏ စံနှုန်းကို လျှော့ချရန် ရည်ရွယ်ချက်မှာ ခုံးပိုကောင်းအောင်ပြုလုပ်ခြင်းပြဿနာအဖြစ် ပုံဖော်နိုင်သည်။ (အနားသတ်များကို ချဲ့ထွင်ခြင်းနှင့် ညီမျှသည်) ကန့်သတ်ချက်များအပေါ် မူတည်သည်။
လေ့ကျင့်ရေးဒေတာအချက်များအားလုံးအတွက်။ သင်္ချာနည်းအားဖြင့် ဤအရာကို ဖော်ပြနိုင်သည်-
အချက်တစ်ချက် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်နေစဉ်အတွင်း ဆင်းသက်လာယူသည့်အခါ သင်္ချာအဆင်ပြေစေရန်အတွက် ပါဝင်သည်။ ဤဖော်မြူလာကို SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာ၏ အဓိကပုံစံအဖြစ် လူသိများသည်။
ဤပိုကောင်းအောင်ပြုလုပ်ခြင်းပြဿနာကိုဖြေရှင်းရန်၊ ပုံမှန်အားဖြင့်၊ တစ်ခုသည် Lagrange အမြှောက်များကဲ့သို့သော ခုံးပိုကောင်းအောင်ပြုလုပ်ခြင်းမှ နည်းပညာများကို အသုံးပြုသည်။ Lagrange အမြှောက်များကို မိတ်ဆက်ပေးခြင်းဖြင့် ကန့်သတ်ချက်တစ်ခုစီအတွက်၊ ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာကို ၎င်း၏နှစ်ထပ်ပုံစံအဖြစ်သို့ ပြောင်းလဲနိုင်သည်၊ အထူးသဖြင့် မြင့်မားသောဒေတာနှင့် ကိုင်တွယ်သောအခါတွင် ဖြေရှင်းရန်ပိုမိုလွယ်ကူသည်။ SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာ၏ နှစ်ထပ်ပုံစံကို အောက်ပါတို့က ပေးထားသည်။
ဘယ်မှာ လေ့ကျင့်ရေးဒေတာအချက်များ အရေအတွက်နှင့်
အနားသတ်ကို ချဲ့ထွင်ခြင်းနှင့် လေ့ကျင့်ရေးဒေတာပေါ်ရှိ အမျိုးအစားခွဲခြားမှု အမှားအယွင်းကို လျှော့ချခြင်းကြား အပေးအယူလုပ်ခြင်းကို ထိန်းချုပ်သည့် ပုံမှန်ပြုလုပ်ခြင်း ဘောင်တစ်ခုဖြစ်သည်။
ဖော်မြူလာနှစ်ခုသည် လိုင်းရိုးခြားခြင်း ဖြစ်နိုင်သည့် ပိုမိုမြင့်မားသော အသွင်အပြင်ကို ပုံဖော်ခြင်းဖြင့် SVMs များကို လိုင်းမဟုတ်သော ခွဲထုတ်နိုင်သော ဒေတာကို ကိုင်တွယ်နိုင်စေမည့် ပေါင်းစပ်ဖော်မြူလာကို လွှမ်းမိုးစေသည်။ အသွင်ပြောင်းခြင်းကို ပြတ်သားစွာလုပ်ဆောင်ခြင်းမရှိဘဲ မြင့်မားသောဘက်ခြမ်းရှိ အာကာသအတွင်း အစက်ကို ပြတ်ပြတ်သားသား တွက်ချက်ပေးသော polynomial kernel၊ radial based function (RBF) kernel နှင့် sigmoid kernel ကဲ့သို့သော kernel လုပ်ဆောင်ချက်များမှ ရရှိသည်။
dual optimization ပြဿနာကို ဖြေရှင်းခြင်းဖြင့်၊ တစ်ဦးသည် အကောင်းဆုံး Lagrange အမြှောက်များကို ရယူသည်။ အကောင်းဆုံးအလေးချိန် vector ကိုဆုံးဖြတ်ရန်အသုံးပြုနိုင်သည့်၊
ဘက်လိုက်မှုဆိုတဲ့ အသုံးအနှုန်းပါ။
. ပံ့ပိုးမှု vector များသည် သုညမဟုတ်သော Lagrange အမြှောက်များဖြင့် ဒေတာအမှတ်များနှင့် ဆက်စပ်နေပြီး ဒေတာအချက်အသစ်များကို ခွဲခြားသတ်မှတ်ရန်အတွက် ဆုံးဖြတ်ချက်လုပ်ဆောင်ချက်
ပေးသည်-
ကန့်သတ်ချက် ထို့ကြောင့် မော်ဒယ်သည် လေ့ကျင့်ရေးဒေတာကို မှန်ကန်စွာ အမျိုးအစားခွဲခြင်းနှင့် အနားသတ်များကို ချဲ့ထွင်ခြင်းကြား ဟန်ချက်ညီညီ ရရှိစေရန် SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းလုပ်ငန်းစဉ်တွင် ပါ၀င်ပါသည်။
ဥပမာတစ်ခုဖြင့် ဤကန့်သတ်ချုပ်ချယ်မှု၏ အရေးပါမှုကို သရုပ်ဖော်ရန်၊ နှစ်ဘက်မြင်ဒေတာအချက်များဖြင့် ရိုးရှင်းသော ဒွိအမျိုးအစားခွဲခြားခြင်းပြဿနာကို သုံးသပ်ကြည့်ပါ။ ကျွန်ုပ်တို့တွင် အောက်ပါလေ့ကျင့်ရေးဒေတာရှိသည်ဆိုပါစို့။
ရည်ရွယ်ချက်မှာ အပြုသဘောဆောင်သော လူတန်းစားကို ပိုင်းခြားထားသည့် အကောင်းဆုံး ဟိုက်ပါလေယာဉ်ကို ရှာဖွေရန်ဖြစ်သည် (အနုတ်လက္ခဏာ လူတန်းစားမှ (
) ဤပြဿနာအတွက် ကန့်သတ်ချက်များကို အောက်ပါအတိုင်း ရေးသားနိုင်သည်။
ဤကန့်သတ်ချက်များနှင့်အတူ SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာကို ဖြေရှင်းခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် အကောင်းဆုံးအလေးချိန် vector ကို ရရှိပါသည်။ ဘက်လိုက်မှုဆိုတဲ့ အသုံးအနှုန်းပါ။
အတန်းနှစ်ခုကို အမြင့်ဆုံးအနားသတ်ဖြင့် ပိုင်းခြားထားသော ဟိုက်ပါလေယာဉ်ကို သတ်မှတ်သည်။
ကန့်သတ်ချက် မတူညီသော အတန်းများကြားအနားသတ်များကို တိုးမြှင့်စေပြီး လေ့ကျင့်ရေးဒေတာအမှတ်များကို မှန်ကန်စွာ အမျိုးအစားခွဲရန် သေချာစေသောကြောင့် SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းလုပ်ငန်းစဉ်အတွက် အရေးကြီးပါသည်။ ၎င်းသည် SVM မော်ဒယ်၏ ပိုမိုကောင်းမွန်သော ယေဘုယျလုပ်ဆောင်နိုင်စွမ်းနှင့် ကြံ့ခိုင်မှုကို ဖြစ်စေသည်။
အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ Python ကို အသုံးပြု၍ EITC/AI/MLP Machine Learning:
- linear regression (အကောင်းဆုံး fit line ၏ y-ကြားဖြတ်) တွင် b parameter ကို မည်သို့တွက်ချက်သနည်း။
- SVM တစ်ခု၏ ဆုံးဖြတ်ချက်နယ်နိမိတ်ကို သတ်မှတ်ရာတွင် အထောက်အကူပြု vector များသည် မည်သည့်အခန်းကဏ္ဍမှ ပါဝင်သနည်း၊ လေ့ကျင့်ရေးလုပ်ငန်းစဉ်အတွင်း ၎င်းတို့ကို မည်သို့ဖော်ထုတ်သနည်း။
- SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်း၏အခြေအနေတွင်၊ အလေးချိန် vector `w` နှင့် bias `b` တို့၏အရေးပါမှုကား အဘယ်နည်း၊ ၎င်းတို့ကို မည်သို့ဆုံးဖြတ်သနည်း။
- SVM အကောင်အထည်ဖော်မှုတွင် `visualize` နည်းလမ်း၏ ရည်ရွယ်ချက်မှာ အဘယ်နည်း၊ ၎င်းသည် မော်ဒယ်၏ စွမ်းဆောင်ရည်ကို နားလည်ရန် မည်သို့ကူညီပေးသနည်း။
- SVM အကောင်အထည်ဖော်မှုတစ်ခုရှိ 'ကြိုတင်ခန့်မှန်းချက်' နည်းလမ်းသည် ဒေတာအချက်အသစ်တစ်ခု၏ အမျိုးအစားခွဲခြင်းကို မည်သို့ဆုံးဖြတ်သနည်း။
- စက်သင်ယူမှုအခြေအနေတွင် Support Vector Machine (SVM) ၏ အဓိကရည်ရွယ်ချက်မှာ အဘယ်နည်း။
- Python တွင် SVM အမျိုးအစားခွဲခြားမှုကို အကောင်အထည်ဖော်ရန် scikit-learn ကဲ့သို့သော စာကြည့်တိုက်များကို မည်သို့အသုံးပြုနိုင်သနည်း၊ သော့ချက်လုပ်ဆောင်ချက်များသည် အဘယ်နည်း။
- SVM ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းပြဿနာ၏ ရည်ရွယ်ချက်မှာ အဘယ်နည်း၊ ၎င်းကို သင်္ချာနည်းဖြင့် မည်သို့ပုံဖော်သနည်း။
- SVM တွင် သတ်မှတ်ထားသော အင်္ဂါရပ်တစ်ခု၏ အမျိုးအစားခွဲခြားမှုသည် ဆုံးဖြတ်ချက်လုပ်ဆောင်ချက်၏ နိမိတ်ပေါ်တွင် မည်သို့မူတည်သနည်း (စာသား{sign}(mathbf{x}_i cdot mathbf{w} + b))။
- Support Vector Machines (SVM) ၏ context ရှိ hyperplane equation (mathbf{x} cdot mathbf{w} + b = 0) ၏ အခန်းကဏ္ဍကား အဘယ်နည်း။
Python ဖြင့် EITC/AI/MLP Machine Learning တွင် နောက်ထပ်မေးခွန်းများနှင့် အဖြေများကို ကြည့်ပါ။