Punan ng mga Panda ng 0 ang Nan

Punan Ng Mga Panda Ng 0 Ang Nan



Karaniwang kinabibilangan ng data science ang nawawalang data. Maaaring itapon ang buong row o maaaring magdagdag ng value sa kumbinasyon ng row-column. Ang pag-drop sa row/column ay magiging absurd dahil inaalis nito ang isang partikular na sukatan para sa bawat row. Ang NaN, na nangangahulugang 'Not a Number', ay isa sa mga karaniwang paraan upang ipakita ang isang value na nawawala sa isang set ng data. Upang makuha ang nilalayong mga resulta, ang paghawak sa NaN ay lubos na mahalaga. Kaya, alamin natin kung paano baguhin ang mga halaga ng NaN sa isang row o column ng isang Pandas DataFrame sa 0.

Punan ng mga Panda ang Mga Halaga ng NaN

Kung ang isang column sa iyong data frame ay may mga halaga ng NaN o Wala, maaari mong gamitin ang mga function na 'fillna()' o 'replace()' upang punan ang mga ito ng zero (0).

punan ()







Ang mga halaga ng NA/NaN ay pinupuno ng ibinigay na diskarte gamit ang function na 'fillna()'. Maaari itong magamit sa pamamagitan ng pagsasaalang-alang sa sumusunod na syntax:



Kung gusto mong punan ang mga halaga ng NaN para sa isang column, ang syntax ay ang mga sumusunod:




Kapag kailangan mong punan ang mga halaga ng NaN para sa kumpletong DataFrame, ang syntax ay tulad ng ibinigay:






Palitan()

Upang palitan ang isang column ng mga halaga ng NaN, ang ibinigay na syntax ay ang mga sumusunod:




Samantalang, upang palitan ang buong halaga ng NaN ng DataFrame, kailangan nating gamitin ang sumusunod na nabanggit na syntax:


Sa piraso ng pagsulat na ito, tutuklasin at matututunan natin ngayon ang praktikal na pagpapatupad ng parehong mga pamamaraang ito upang punan ang mga halaga ng NaN sa ating Pandas DataFrame.

Halimbawa 1: Punan ang Mga Halaga ng NaN Gamit ang Paraang “Fillna()” ng Panda

Ang paglalarawang ito ay nagpapakita ng aplikasyon ng Pandas “DataFrame.fillna()” function upang punan ang mga halaga ng NaN sa ibinigay na DataFrame ng 0. Maaari mong punan ang mga nawawalang halaga sa isang column o maaari mong punan ang mga ito para sa buong DataFrame. Dito, makikita natin ang parehong mga diskarteng ito.

Upang maisakatuparan ang mga estratehiyang ito, kailangan nating kumuha ng naaangkop na plataporma para sa pagpapatupad ng programa. Kaya, nagpasya kaming gamitin ang tool na 'Spyder'. Sinimulan namin ang aming Python code sa pamamagitan ng pag-import ng toolkit na 'pandas' sa programa dahil kailangan naming gamitin ang tampok na Pandas upang bumuo ng DataFrame pati na rin upang punan ang mga nawawalang halaga sa DataFrame na iyon. Ang 'pd' ay ginagamit bilang alyas ng 'pandas' sa buong programa.

Ngayon, mayroon na kaming access sa mga feature ng Pandas. Una naming ginagamit ang function na 'pd.DataFrame()' nito upang buuin ang aming DataFrame. Ginawa namin ang paraang ito at sinimulan ito ng tatlong column. Ang mga pamagat ng mga column na ito ay 'M1', 'M2', at 'M3'. Ang mga value sa column na “M1” ay “1”, “Wala”, “5”, “9”, at “3”. Ang mga entry sa 'M2' ay 'Wala', '3', '8', '4', at '6'. Habang iniimbak ng 'M3' ang data bilang '1', '2', '3', '5', at 'Wala'. Nangangailangan kami ng object ng DataFrame kung saan maiimbak namin ang DataFrame na ito kapag tinawag ang 'pd.DataFrame()' na paraan. Gumawa kami ng 'nawawalang' DataFrame object at itinalaga ito ayon sa kinalabasan na nakuha namin mula sa function na 'pd.DataFrame()'. Pagkatapos, ginamit namin ang 'print()' na paraan ng Python upang ipakita ang DataFrame sa Python console.


Kapag pinatakbo namin ang chunk of code na ito, ang isang DataFrame na may tatlong column ay maaaring matingnan sa terminal. Dito, mapapansin natin na lahat ng tatlong column ay naglalaman ng mga null value sa mga ito.


Gumawa kami ng DataFrame na may ilang null value para ilapat ang Pandas “fillna()” function para punan ang mga nawawalang value ng 0. Alamin natin kung paano natin magagawa iyon.

Pagkatapos ipakita ang DataFrame, tinawag namin ang function na 'fillna()' ng Pandas. Dito, matututunan nating punan ang mga nawawalang halaga sa isang column. Ang syntax para dito ay nabanggit na sa simula ng tutorial. Ibinigay namin ang pangalan ng DataFrame at tinukoy ang partikular na pamagat ng column gamit ang function na '.fillna()'. Sa pagitan ng mga panaklong ng paraang ito, ibinigay namin ang halaga na ilalagay sa mga null na lugar. Ang pangalan ng DataFrame ay 'nawawala' at ang column na pinili namin dito ay 'M2'. Ang value na ibinigay sa pagitan ng mga brace ng “fillna()” ay “0”. Panghuli, tinawag namin ang function na 'print()' upang tingnan ang na-update na DataFrame.


Dito, makikita mo na ang column na “M2” ng DataFrame ay walang anumang nawawalang value ngayon dahil ang NaN value ay puno ng 0.


Upang punan ang mga halaga ng NaN para sa isang buong DataFrame ng parehong paraan, tinawag namin ang 'fillna()'. Ito ay medyo simple. Ibinigay namin ang pangalan ng DataFrame ng function na 'fillna()' at itinalaga ang value ng function na '0' sa pagitan ng mga panaklong. Sa wakas, ipinakita sa amin ng function na 'print()' ang punong DataFrame.


Nagbibigay ito sa amin ng DataFrame na walang mga halaga ng NaN dahil ang lahat ng mga halaga ay muling pinupunan ng 0 ngayon.

Halimbawa 2: Punan ang Mga Halaga ng NaN Gamit ang Paraang 'Palitan()' ng Panda

Ang bahaging ito ng artikulo ay nagpapakita ng isa pang paraan upang punan ang mga halaga ng NaN sa isang DataFrame. Gagamitin namin ang function na 'replace()' ng Pandas para punan ang mga value sa isang column at sa kumpletong DataFrame.

Nagsisimula kaming isulat ang code sa tool na 'Spyder'. Una, na-import namin ang mga kinakailangang aklatan. Dito, ni-load namin ang library ng Pandas upang paganahin ang Python program na gamitin ang mga pamamaraan ng Pandas. Ang pangalawang library na na-load namin ay NumPy at alias ito sa 'np'. Pinangangasiwaan ng NumPy ang nawawalang data gamit ang pamamaraang “replace()”.

Pagkatapos, nakabuo kami ng DataFrame na mayroong tatlong column – “screw”, “nail” at “drill”. Ang mga halaga sa bawat column ay ibinibigay ayon sa pagkakabanggit. Ang column na 'screw' ay may mga value na '112', '234', 'Wala', at '650'. Ang column na 'nail' ay may '123', '145', 'None', at '711'. Panghuli, ang column na 'drill' ay may mga value na '312', 'Wala', '500', at 'Wala'. Ang DataFrame ay naka-imbak sa “tool” DataFrame object at ipinapakita gamit ang “print()” na paraan.


Ang isang DataFrame na may apat na halaga ng NaN sa tala ay makikita sa sumusunod na larawang output:


Ngayon, ginagamit namin ang pamamaraang 'replace()' ng Pandas upang punan ang mga null value sa isang column ng DataFrame. Para sa gawain, ginamit namin ang function na 'replace()'. Ibinigay namin ang pangalan ng DataFrame na 'tool' at column na 'screw' gamit ang '.replace()' na paraan. Sa pagitan ng mga brace nito, itinakda namin ang value na '0' para sa mga entry na 'np.nan' sa DataFrame. Ang 'print()' na paraan ay ginagamit upang ipakita ang output.


Ipinapakita sa amin ng nagreresultang DataFrame ang unang column na may mga NaN na entry na pinapalitan ng 0 sa column na 'screw'.


Ngayon, matututunan nating punan ang mga halaga sa buong DataFrame. Tinawag namin ang 'replace()' method na may pangalan ng DataFrame at ibinigay ang value na gusto naming palitan ng mga np.nan na entry. Sa wakas, na-print namin ang na-update na DataFrame gamit ang function na 'print()'.


Nagbubunga ito sa amin ng resultang DataFrame na walang nawawalang mga tala.

Konklusyon

Ang pagharap sa mga nawawalang entry sa isang DataFrame ay isang pundamental at isang kinakailangang kinakailangan upang mabawasan ang pagiging kumplikado at mapangasiwaan ang data nang mapanlinlang sa proseso ng pagsusuri ng data. Ang mga Panda ay nagbibigay sa amin ng ilang mga pagpipilian upang makayanan ang problemang ito. Nagdala kami ng dalawang madaling gamitin na estratehiya sa gabay na ito. Isinasagawa namin ang parehong mga diskarte sa tulong ng tool na 'Spyder' upang maisakatuparan ang mga sample na code upang gawing medyo naiintindihan at mas madali ang mga bagay para sa iyo. Ang pagkakaroon ng kaalaman sa mga function na ito ay magpapatalas sa iyong mga kasanayan sa Pandas.