ဥပမာတွင်အသုံးပြုထားသော Iris dataset ကိုရှာဖွေရန် UCI Machine Learning Repository မှတဆင့် ၎င်းကိုဝင်ရောက်ကြည့်ရှုနိုင်ပါသည်။ Iris dataset သည် အမျိုးအစားခွဲခြင်းလုပ်ငန်းတာဝန်များအတွက် စက်သင်ယူခြင်းနယ်ပယ်တွင် အသုံးများသောဒေတာအစုံဖြစ်ပြီး အထူးသဖြင့် စက်ပိုင်းဆိုင်ရာသင်ယူမှု အယ်လဂိုရီသမ်များကို သရုပ်ပြရာတွင် ရိုးရှင်းပြီး ထိရောက်မှုရှိသောကြောင့် ပညာရေးဆိုင်ရာအခြေအနေများတွင်ဖြစ်သည်။
UCI Machine Learning Repository သည် သုတေသနနှင့် ပညာရေးဆိုင်ရာ ရည်ရွယ်ချက်များအတွက် အမျိုးမျိုးသော ဒေတာအတွဲများကို လက်ခံကျင်းပပေးသည့် စက်သင်ယူမှုအသိုင်းအဝိုင်းတွင် တွင်ကျယ်စွာအသုံးပြုသည့် အရင်းအမြစ်တစ်ခုဖြစ်သည်။ Iris dataset သည် UCI repository တွင် ရရှိနိုင်သော datasets များထဲမှ တစ်ခုဖြစ်ပြီး သင်၏ machine learning ပရောဂျက်များတွင် အသုံးပြုရန်အတွက် အလွယ်တကူ ဝင်ရောက်နိုင်ပါသည်။
UCI Machine Learning Repository မှ Iris ဒေတာအတွဲကို ပြန်လည်ရယူရန် အောက်ပါအဆင့်များကို လိုက်နာနိုင်သည်-
1. https://archive.ics.uci.edu/ml/index.php ရှိ UCI Machine Learning Repository ဝဘ်ဆိုဒ်သို့ ဝင်ရောက်ကြည့်ရှုပါ။
2. ဝဘ်ဆိုက်ရှိ "ဒေတာအတွဲများ" ကဏ္ဍသို့ သွားပါ။
3. ရရှိနိုင်သော ဒေတာအတွဲများကို ရှာဖွေခြင်း သို့မဟုတ် ဝဘ်ဆိုက်ရှိ ရှာဖွေမှုလုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းဖြင့် Iris ဒေတာအတွဲကို ရှာဖွေပါ။
4. အသုံးပြုထားသော စက်သင်ယူမှုပတ်ဝန်းကျင်နှင့် တွဲဖက်အသုံးပြုနိုင်သည့် ဖော်မတ်ဖြင့် ဒေါင်းလုဒ်လုပ်ပါ။ ဒေတာအတွဲကို ပုံမှန်အားဖြင့် CSV (Comma-Separated Values) ဖော်မတ်ဖြင့် ရရှိနိုင်ပြီး ဒေတာကို ခြယ်လှယ်ခြင်းနှင့် ခွဲခြမ်းစိတ်ဖြာရန်အတွက် Python's pandas စာကြည့်တိုက်ကဲ့သို့ ကိရိယာများတွင် အလွယ်တကူ ထည့်သွင်းနိုင်သည်။
တနည်းအားဖြင့်၊ Python ရှိ scikit-learn ကဲ့သို့သော နာမည်ကြီး စက်သင်ယူမှု စာကြည့်တိုက်များမှတဆင့် Iris dataset ကို တိုက်ရိုက်ဝင်ရောက်ကြည့်ရှုနိုင်ပါသည်။ Scikit-learn သည် Iris ဒေတာအတွဲကို ဒေါင်းလုဒ်ဆွဲရန်မလိုဘဲ အသုံးပြုသူများအတွက် ဒေတာအတွဲကို သီးသန့်ဝင်ရောက်ရန် အဆင်ပြေစေမည့် Built-in လုပ်ဆောင်ချက်များကို ပံ့ပိုးပေးပါသည်။
အောက်တွင် Iris ဒေတာအတွဲကို တင်ရန် scikit-learn ကို အသုံးပြု၍ Python ရှိ နမူနာကုဒ်အတိုအထွာတစ်ခုဖြစ်သည်။
python from sklearn.datasets import load_iris # Load the Iris dataset iris = load_iris() # Access the features and target labels X = iris.data y = iris.target # Print the shape of the dataset print("Shape of the Iris dataset:", X.shape)
အထက်ဖော်ပြပါ ကုဒ်အတိုအထွာကို လုပ်ဆောင်ခြင်းဖြင့် Iris ဒေတာအတွဲကို scikit-learn ကို အသုံးပြု၍ Python ပတ်ဝန်းကျင်သို့ တိုက်ရိုက်တင်နိုင်ပြီး စက်သင်ယူမှုဆိုင်ရာ လုပ်ဆောင်စရာအချို့အတွက် ဒေတာအတွဲနှင့် စတင်လုပ်ဆောင်နိုင်သည်။
အခြား လတ်တလောမေးခွန်းများနှင့် အဖြေများ EITC/AI/GCML Google Cloud Machine Learning:
- Text to speech (TTS) ဆိုတာ ဘာလဲ၊ AI နဲ့ ဘယ်လိုအလုပ်လုပ်သလဲ။
- စက်သင်ယူမှုတွင် ကြီးမားသောဒေတာအတွဲများနှင့် လုပ်ဆောင်ရာတွင် ကန့်သတ်ချက်များကား အဘယ်နည်း။
- စက်သင်ယူခြင်းသည် ဒိုင်ယာလော့ဂ်အကူအညီအချို့ကို ပေးနိုင်ပါသလား။
- TensorFlow ကစားကွင်းဆိုတာဘာလဲ။
- ပိုကြီးသောဒေတာအတွဲသည် အမှန်တကယ် ဘာကိုဆိုလိုသနည်း။
- algorithm ၏ hyperparameters များ၏ ဥပမာအချို့ကား အဘယ်နည်း။
- Ensamble Learning ဆိုတာ ဘာလဲ။
- ရွေးချယ်ထားသော machine learning algorithm သည် မသင့်လျော်ပါက မည်ကဲ့သို့ မှန်ကန်သည်ကို ရွေးချယ်ရန် သေချာနိုင်မည်နည်း။
- စက်သင်ယူမှုပုံစံသည် ၎င်း၏လေ့ကျင့်နေစဉ်အတွင်း ကြီးကြပ်မှုလိုအပ်ပါသလား။
- အာရုံကြောကွန်ရက်အခြေပြု အယ်လဂိုရီသမ်များတွင် အသုံးပြုသည့် အဓိက ကန့်သတ်ဘောင်များသည် အဘယ်နည်း။
EITC/AI/GCML Google Cloud Machine Learning တွင် နောက်ထပ်မေးခွန်းများနှင့် အဖြေများကို ကြည့်ပါ။