စာတမ်းအမျိုးအစားခွဲခြားခြင်းအတွက် Neural Structured Learning (NSL) မော်ဒယ်ကို တည်ဆောက်ခြင်းတွင် အဆင့်များစွာပါဝင်ပြီး၊ တစ်ခုစီသည် ခိုင်မာပြီး တိကျသောပုံစံတစ်ခုကို တည်ဆောက်ရာတွင် အရေးကြီးပါသည်။ ဤရှင်းလင်းချက်တွင်၊ အဆင့်တစ်ခုစီ၏ ကျယ်ကျယ်ပြန့်ပြန့် နားလည်မှုကို ပေးစွမ်းပြီး ထိုကဲ့သို့သော ပုံစံတည်ဆောက်ခြင်း၏ အသေးစိတ်လုပ်ငန်းစဉ်ကို ကျွန်ုပ်တို့ စေ့စေ့စပ်စပ်လေ့လာပါမည်။
အဆင့် 1: ဒေတာပြင်ဆင်ခြင်း။
ပထမအဆင့်မှာ စာရွက်စာတမ်း အမျိုးအစားခွဲခြင်းအတွက် အချက်အလက်များကို စုဆောင်းပြီး ကြိုတင်လုပ်ဆောင်ရန်ဖြစ်သည်။ ၎င်းတွင် လိုချင်သော အမျိုးအစားများ သို့မဟုတ် အတန်းများကို အကျုံးဝင်သည့် မတူကွဲပြားသော စာရွက်စာတမ်းများ စုဆောင်းခြင်း ပါဝင်သည်။ စာရွက်စာတမ်းတစ်ခုစီသည် မှန်ကန်သောအတန်းနှင့် ဆက်စပ်မှုရှိစေရန် ဒေတာကို အညွှန်းတပ်ရပါမည်။ ကြိုတင်လုပ်ဆောင်ခြင်းတွင် မလိုအပ်သော အက္ခရာများကို ဖယ်ရှားခြင်း၊ စာလုံးသေးအဖြစ် ပြောင်းလဲခြင်းနှင့် စာသားကို စကားလုံးများ သို့မဟုတ် စကားလုံးခွဲများအဖြစ် သင်္ကေတပြုလုပ်ခြင်းဖြင့် စာသားကို သန့်ရှင်းခြင်းတွင် ပါဝင်ပါသည်။ ထို့အပြင်၊ TF-IDF သို့မဟုတ် စကားလုံးထည့်သွင်းခြင်းကဲ့သို့သော အင်္ဂါရပ်အင်ဂျင်နီယာနည်းပညာများကို ပိုမိုဖွဲ့စည်းပုံပုံစံဖြင့် စာသားကိုကိုယ်စားပြုရန် အသုံးပြုနိုင်သည်။
အဆင့် 2- ဂရပ်ဖစ်တည်ဆောက်မှု
Neural Structured Learning တွင် စာရွက်စာတမ်းများကြား ဆက်စပ်မှုများကို ဖမ်းယူရန် ဒေတာကို ဂရပ်ပုံစံအဖြစ် ကိုယ်စားပြုသည်။ ဂရပ်ကို ၎င်းတို့၏ အကြောင်းအရာ တူညီမှုအပေါ် အခြေခံ၍ အလားတူစာရွက်စာတမ်းများကို ချိတ်ဆက်ခြင်းဖြင့် တည်ဆောက်ထားသည်။ k-အနီးဆုံး အိမ်နီးချင်း (KNN) သို့မဟုတ် cosine ဆင်တူယိုးမှား ကဲ့သို့သော နည်းစနစ်များကို အသုံးပြုခြင်းဖြင့် ၎င်းကို အောင်မြင်နိုင်သည်။ မတူညီသောအတန်းများ၏ စာရွက်စာတမ်းများကြားချိတ်ဆက်မှုများကို ကန့်သတ်ထားချိန်တွင် တူညီသောအတန်း၏စာရွက်စာတမ်းများကြားချိတ်ဆက်မှုကို အားပေးသည့်နည်းဖြင့် ဂရပ်ကိုတည်ဆောက်သင့်သည်။
အဆင့် 3- ရန်ဘက်ပြုလေ့ကျင့်ခြင်း။
Adversarial Training သည် Neural Structured Learning ၏ အဓိကအစိတ်အပိုင်းတစ်ခုဖြစ်သည်။ ၎င်းသည် မော်ဒယ်အား အညွှန်းတပ်ထားသော နှင့် အညွှန်းမပါသော ဒေတာ နှစ်ခုစလုံးမှ သင်ယူစေပြီး ၎င်းကို ပိုမိုကြံ့ခိုင်ပြီး ယေဘူယျရနိုင်စေပါသည်။ ဤအဆင့်တွင်၊ တံဆိပ်မပါသောဒေတာကို တပြိုင်နက်တည်း နှောင့်ယှက်နေချိန်တွင် မော်ဒယ်ကို တံဆိပ်တပ်ထားသောဒေတာတွင် လေ့ကျင့်ထားသည်။ ထည့်သွင်းဒေတာတွင် ကျပန်းဆူညံသံ သို့မဟုတ် ဆန့်ကျင်ဘက်တိုက်ခိုက်မှုများကို ထည့်သွင်းခြင်းဖြင့် အနှောင့်အယှက်များကို မိတ်ဆက်နိုင်သည်။ မော်ဒယ်သည် ဤနှောင့်ယှက်မှုများကို အထိခိုက်မခံစေရန် လေ့ကျင့်ပေးထားပြီး မမြင်ရသော ဒေတာများတွင် စွမ်းဆောင်ရည် ပိုကောင်းလာစေရန် လေ့ကျင့်ထားသည်။
အဆင့် 4: မော်ဒယ်ဗိသုကာ
စာရွက်စာတမ်းအမျိုးအစားခွဲခြားခြင်းအတွက် သင့်လျော်သော မော်ဒယ်ဗိသုကာကို ရွေးချယ်ခြင်းသည် အရေးကြီးပါသည်။ ဘုံရွေးချယ်မှုများတွင် convolutional neural networks (CNNs)၊ recurrent neural networks (RNNs) သို့မဟုတ် transformer modelများ ပါဝင်သည်။ စာရွက်စာတမ်းများကြားချိတ်ဆက်မှုကို ထည့်သွင်းစဉ်းစားကာ ဂရပ်ပုံစံတည်ဆောက်ထားသည့်ဒေတာကို ကိုင်တွယ်ရန် မော်ဒယ်ကို ဒီဇိုင်းထုတ်သင့်သည်။ ဂရပ်ဖစ်ဖွဲ့စည်းပုံအား လုပ်ဆောင်ရန်နှင့် အဓိပ္ပာယ်ပြည့်ဝသော ကိုယ်စားပြုမှုများကို ထုတ်နုတ်ရန်အတွက် ဂရပ်ဖ် convolutional networks (GCNs) သို့မဟုတ် ဂရပ်အာရုံစူးစိုက်မှုကွန်ရက်များ (GATs) ကို မကြာခဏ အသုံးပြုပါသည်။
အဆင့် 5- လေ့ကျင့်ရေးနှင့် အကဲဖြတ်ခြင်း။
မော်ဒယ်ဗိသုကာကို သတ်မှတ်ပြီးသည်နှင့် နောက်တစ်ဆင့်မှာ တံဆိပ်တပ်ထားသော အချက်အလက်ကို အသုံးပြု၍ မော်ဒယ်ကို လေ့ကျင့်ရန် ဖြစ်သည်။ လေ့ကျင့်ရေးလုပ်ငန်းစဉ်တွင် stochastic gradient descent (SGD) သို့မဟုတ် Adam optimizer ကဲ့သို့သော နည်းစနစ်များကို အသုံးပြု၍ မော်ဒယ်၏ ကန့်သတ်ချက်များကို ပိုကောင်းအောင်ပြုလုပ်ခြင်း ပါဝင်သည်။ သင်တန်းကာလအတွင်း၊ မော်ဒယ်သည် ၎င်းတို့၏အင်္ဂါရပ်များနှင့် ဂရပ်တည်ဆောက်ပုံတွင် ရိုက်ကူးထားသော ဆက်ဆံရေးများကို အခြေခံ၍ စာရွက်စာတမ်းများကို အမျိုးအစားခွဲရန် သင်ယူသည်။ လေ့ကျင့်ပြီးနောက်၊ မော်ဒယ်အား ၎င်း၏စွမ်းဆောင်ရည်ကိုတိုင်းတာရန် သီးခြားစမ်းသပ်မှုတစ်ခုပေါ်တွင် အကဲဖြတ်သည်။ တိကျမှု၊ တိကျမှု၊ ပြန်လည်သိမ်းဆည်းမှုနှင့် F1 ရမှတ်များကဲ့သို့သော အကဲဖြတ်မက်ထရစ်များကို မော်ဒယ်၏ထိရောက်မှုကို အကဲဖြတ်ရန် အများအားဖြင့် အသုံးပြုကြသည်။
အဆင့် 6- Fine-tuning နှင့် Hyperparameter Tuning
မော်ဒယ်၏ စွမ်းဆောင်ရည်ကို ပိုမိုတိုးတက်စေရန်၊ ချိန်ညှိခြင်းအား အသုံးပြုနိုင်သည်။ ၎င်းတွင် လွှဲပြောင်းသင်ယူမှု သို့မဟုတ် သင်ယူမှုနှုန်း အချိန်ဇယားဆွဲခြင်းကဲ့သို့သော နည်းစနစ်များကို အသုံးပြု၍ မော်ဒယ်၏ ဘောင်များကို ချိန်ညှိခြင်း ပါဝင်သည်။ မော်ဒယ်၏စွမ်းဆောင်ရည်ကို ကောင်းမွန်အောင်ပြုလုပ်ရာတွင် Hyperparameter ချိန်ညှိခြင်းသည်လည်း အရေးကြီးပါသည်။ သင်ယူမှုနှုန်း၊ အစုလိုက်အရွယ်အစားနှင့် ပုံမှန်ပြုလုပ်နိုင်စွမ်းကဲ့သို့သော ကန့်သတ်ချက်များကို ဂရစ်ရှာခြင်း သို့မဟုတ် ကျပန်းရှာဖွေခြင်းကဲ့သို့သော နည်းစနစ်များကို အသုံးပြု၍ ချိန်ညှိနိုင်သည်။ အကောင်းမွန်ဆုံး ချိန်ညှိခြင်းနှင့် ဟိုက်ပါပါရာမီတာ ချိန်ညှိခြင်း၏ ထပ်တလဲလဲ လုပ်ငန်းစဉ်သည် အကောင်းဆုံးဖြစ်နိုင်သော စွမ်းဆောင်ရည်ကို ရရှိစေရန် ကူညီပေးသည်။
အဆင့် 7- အနုမာနနှင့် အသုံးချမှု
မော်ဒယ်ကို လေ့ကျင့်ပြီး ကောင်းစွာ ချိန်ညှိပြီးသည်နှင့်၊ ၎င်းကို စာရွက်စာတမ်း အမျိုးအစားခွဲခြင်း လုပ်ငန်းများအတွက် အသုံးပြုနိုင်ပါသည်။ အသစ်၊ မမြင်ရသော စာရွက်စာတမ်းများကို မော်ဒယ်တွင် ထည့်သွင်းနိုင်ပြီး သင်ယူထားသည့် ပုံစံများအပေါ် အခြေခံ၍ ၎င်းတို့၏ သက်ဆိုင်ရာ အတန်းများကို ခန့်မှန်းပေးမည်ဖြစ်သည်။ အချိန်နှင့်တစ်ပြေးညီ စာရွက်စာတမ်း အမျိုးအစားခွဲခြားနိုင်မှုအား ပံ့ပိုးပေးရန်အတွက် မော်ဒယ်ကို ဝဘ်အက်ပ်များ၊ APIများ၊ သို့မဟုတ် မြှုပ်သွင်းထားသော စနစ်များကဲ့သို့သော ပတ်ဝန်းကျင်အမျိုးမျိုးတွင် အသုံးချနိုင်သည်။
စာတမ်းအမျိုးအစားခွဲခြားခြင်းအတွက် အာရုံကြောဖွဲ့စည်းပုံသင်ယူမှုပုံစံတစ်ခုတည်ဆောက်ခြင်းတွင် ဒေတာပြင်ဆင်မှု၊ ဂရပ်တည်ဆောက်မှု၊ ဆန့်ကျင်ဘက်လေ့ကျင့်မှု၊ မော်ဒယ်ဗိသုကာရွေးချယ်မှု၊ လေ့ကျင့်မှု၊ အကဲဖြတ်မှု၊ ညှိုနှိုင်းချိန်ညှိမှု၊ hyperparameter ချိန်ညှိခြင်းနှင့် နောက်ဆုံးအချက်၊ အနုမာနနှင့် ဖြန့်ကျက်ခြင်းတို့ ပါဝင်သည်။ အဆင့်တစ်ဆင့်ချင်းစီသည် စာရွက်စာတမ်းများကို ထိထိရောက်ရောက် အမျိုးအစားခွဲခြားနိုင်သည့် တိကျပြီး ခိုင်မာသောပုံစံတစ်ခုကို တည်ဆောက်ရာတွင် အရေးကြီးသောအခန်းကဏ္ဍမှ ပါဝင်ပါသည်။
အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ EITC/AI/TFF TensorFlow အခြေခံများ:
- စာလုံးများကို vector များအဖြစ် ကိုယ်စားပြုသည့်ကွက်တစ်ခုအတွက် သင့်လျော်သော ပုဆိန်များကို အလိုအလျောက်သတ်မှတ်ရန် မြှပ်ထားသောအလွှာကို မည်သို့အသုံးပြုရမည်နည်း။
- CNN တွင် အမြင့်ဆုံးပေါင်းထည့်ခြင်း၏ ရည်ရွယ်ချက်ကား အဘယ်နည်း။
- convolutional neural network (CNN) ရှိ အင်္ဂါရပ် ထုတ်ယူခြင်းလုပ်ငန်းစဉ်သည် ရုပ်ပုံအသိအမှတ်ပြုခြင်းတွင် မည်သို့သက်ရောက်သနည်း။
- TensorFlow.js တွင်အသုံးပြုနေသည့် စက်သင်ယူမှုမော်ဒယ်များအတွက် အညီအမျှ သင်ယူမှုလုပ်ဆောင်ချက်ကို အသုံးပြုရန် လိုအပ်ပါသလား။
- TensorFlow Keras Tokenizer API သည် စကားလုံးများ၏ အများဆုံး အရေအတွက် ကန့်သတ်ချက် ဆိုသည်မှာ အဘယ်နည်း။
- TensorFlow Keras Tokenizer API ကို အသုံးအများဆုံး စကားလုံးများကို ရှာတွေ့နိုင်ပါသလား။
- TOCO ဆိုတာဘာလဲ။
- စက်သင်ယူမှုပုံစံတစ်ခုရှိ ခေတ်များစွာ၏ ဆက်စပ်မှုနှင့် မော်ဒယ်ကို လုပ်ဆောင်ခြင်းမှ ခန့်မှန်းချက် တိကျမှုတို့အကြား ဆက်စပ်မှုမှာ အဘယ်နည်း။
- TensorFlow ၏ Neural Structured Learning တွင်ရှိသော အိမ်နီးချင်း API သည် သဘာဝဂရပ်ဒေတာကို အခြေခံ၍ တိုးမြှင့်ထားသော လေ့ကျင့်ရေးဒေတာအတွဲကို ထုတ်လုပ်ပါသလား။
- TensorFlow ၏ Neural Structured Learning တွင် pack အိမ်နီးချင်း API သည် အဘယ်နည်း။
EITC/AI/TFF TensorFlow Fundamentals တွင် နောက်ထပ်မေးခွန်းများနှင့် အဖြေများကို ကြည့်ပါ။