Ano ang Cross-Validation sa AWS?

Ano Ang Cross Validation Sa Aws



Ginagamit ang Machine Learning upang maglapat ng iba't ibang modelo sa ibinigay na data upang mahulaan ang hinaharap batay sa data na ginagamit upang sanayin ang mga ito. Mayroong iba't ibang mga modelo ng machine learning na nag-e-embed ng artificial intelligence tulad ng logistic regression, K-Nearest neighbors, atbp. Para malaman kung aling modelo ang dapat ilapat ayon sa dataset at maaaring gawin sa pamamagitan ng cross-validation ang mga sitwasyon.

Ipapaliwanag ng gabay na ito ang cross-validation at ang pagtatrabaho nito gamit ang AWS Service.

Ano ang Cross-Validation?

Ang Cross-Validation ay nagbibigay-daan sa mga developer na paghambingin ang iba't ibang modelo ng machine-learning at magkaroon ng kahulugan sa kanilang pagtatrabaho sa totoong buhay. Nakakatulong ito sa user na malaman kung aling modelo ng Machine Learning (ML) o Deep Learning (DL) ang gagana nang mas mahusay para sa isang partikular na data o senaryo. May mga sitwasyon kung kailan maraming modelo ang maaaring gamitin para sa isang dataset, dito ginagamit ng mga developer ang cross-validation upang makakuha ng angkop na modelo upang makakuha ng mga na-optimize na resulta:









Paano Gumagana ang Cross-Validation?

Upang suriin ang mga modelo ng ML sa isang dataset, kailangang tantyahin ng user ang mga feature ng modelo na tinatawag na pagsasanay sa algorithm. Ang isa pang bagay na dapat suriin ay ang pagsusuri ng modelo upang malaman kung gaano ito gumanap at ito ay tinatawag na pagsubok ng modelo. Hindi magandang ideya na subukan ang modelo sa lahat ng data gayunpaman, ginagamit namin ang 75% ng data para sa pagsasanay at 25% para sa pagsubok upang makakuha ng mas magagandang resulta. Ang cross-validation ay nagsasagawa ng pagsubok sa bawat 25% ng data upang masuri kung aling bloke ang gumaganap ng pinakamahusay:







Ano ang Amazon SageMaker?

Maaaring gawin ang cross-validation sa AWS gamit ang serbisyo ng Amazon SageMaker dahil idinisenyo ito upang bumuo, magsanay, at mag-deploy ng mga modelo ng machine learning. Tinutulungan nito ang mga data scientist at developer na maghanda ng data para sa pagbuo ng mahusay na mga modelo ng ML o DL sa pamamagitan ng pagsasama-sama ng mga kakayahan na binuo ng layunin. Ang mga kakayahang ito ay kapaki-pakinabang upang bumuo ng mga na-optimize at tumpak na mga modelo na magkakaroon ng kakayahang mapabuti sa paglipas ng panahon:



Mga Tampok ng Amazon SageMaker

Ang Amazon SageMaker ay isang pinamamahalaang serbisyo at hindi ito nangangailangan ng pamamahala ng mga ML environment. Nangangailangan ito ng maraming data upang sanayin at bumuo ng mga modelo ng ML upang mahusay itong kumonekta sa mga serbisyo ng Amazon S3 o Amazon Redshift upang mangolekta ng data. Maaaring mahirap makakuha ng impormasyon ang raw data kaya nangangailangan din ito ng mga feature para bumuo ng mga modelo. Pagkatapos ay gamitin ang data para sanayin ang mga modelo at pagkatapos ay magsagawa ng mga pagsubok dito gamit ang bawat 25% ng data para makakuha ng mas magagandang resulta/hula:

Iyon ay tungkol sa cross-validation sa AWS.

Konklusyon

Ang cross-validation ay ang proseso ng pagkuha ng pinakamainam na machine learning o deep learning model para sa data na makakuha ng mas magagandang resulta. Magsasagawa ito ng pagsubok para sa bawat 25% na seksyon ng data upang maunawaan kung aling bloke ang nagbibigay ng maximum na output na ginagawa itong isang naaangkop na modelo ng akma. Nagbibigay ang AWS ng serbisyo ng SageMaker para magsagawa ng cross-validation at bumuo ng mga modelo ng machine learning sa cloud. Ipinaliwanag ng gabay na ito ang proseso ng cross-validation at ang paggana nito sa AWS.