Natatanging Pandas Dataframe

Natatanging Pandas Dataframe



Ang pinakasikat na library ng Python na ginagamit sa data science ay tinatawag na Pandas. Nag-aalok ito ng mga Python programmer na may mataas na pagganap, madaling gamitin, at mga tool sa pagsusuri ng data. Kapag naunawaan mo na ang mga pangunahing pag-andar at kung paano gamitin ang mga ito, ang Pandas ay isang mabisang tool para sa pagbabago ng data. Sa 'pandas' ang mga karaniwang pamamaraan para sa pag-iimbak ng data sa isang tabular na form ay ang DataFrames. Maaari naming gamitin ang ilang pamamaraan ng 'pandas' para makuha ang mga natatanging halaga sa column ng 'pandas' DataFrame. Kapag kailangan nating kumuha ng mga natatanging value sa mga column ng DataFrame at ayaw nating duplikasyon ng mga value sa column ng 'pandas' DataFrame, maaari nating gamitin ang mga pamamaraan na ibinibigay ng 'pandas' para sa paggawa nito. Tingnan natin ang mga ganitong pamamaraan sa gabay na ito, kasama ang ilang mga halimbawa at output upang makakuha ng mga natatanging halaga sa column ng DataFrame ng 'pandas'.

Mga Paraan para sa Pagkuha ng Mga Natatanging Halaga sa Mga Column ng DataFrame ng 'pandas'.

Maaari naming gamitin ang dalawang paraan para makuha ang mga natatanging halaga sa mga column ng DataFrame ng 'pandas'. Ibinababa namin ang mga duplicate na halaga at nakukuha lang namin ang mga natatanging halaga sa mga column ng DataFrames. Ang mga pamamaraan na ibinibigay ng 'pandas' para sa paggawa ng gawaing ito ay:







  • Sa pamamagitan ng paggamit ng unique() na pamamaraan.
  • Sa pamamagitan ng paggamit ng drop_dupliactes() na paraan.

Ngayon, gagamitin namin ang parehong mga pamamaraan sa mga code ng 'pandas' para makuha ang mga natatanging halaga sa mga column ng 'pandas' DataFrame.



Halimbawa # 01

Ang 'Spyder' na app ay ginagamit dito para sa pagbuo ng mga 'pandas' na code upang magamit ang mga pamamaraang iyon na makakatulong sa amin sa pagkuha ng mga natatanging halaga sa mga column ng 'pandas' DataFrame. Dapat nating i-import ang mga module ng 'pandas', na kinakailangan para sa code ng 'pandas', bago gawin ang DataFrame. Sa pamamagitan ng paggamit ng terminong 'import' at paglalagay ng 'pandas bilang pd,' ini-import namin ang mga module na ito.



Ngayon, sa tulong ng 'pd', mabilis nating makukuha ang mga function o pamamaraan ng 'pandas'. Pagkatapos ay inilagay namin ang 'Subject_data' kung saan idinagdag namin ang 'Pangalan' at sa 'Pangalan', idinaragdag namin ang data ng pangalan na 'Roman, William, Peter, Smith, John, Milli, Thomas, at James'. Pagkatapos, idinagdag namin ang data ng paksa sa 'Subj' na 'Maths, Economics, Science, Maths, Statistics, Statistics, Statistics, at Computer'. Pagkatapos, iko-convert namin itong 'Subject_data' sa 'Subject_df' DataFrame sa pamamagitan ng paggamit ng 'pd.DataFrame()' na paraan. Inilalagay namin ang 'Subject_df' sa 'print()' na paraan upang ito ay ipakita sa terminal.





Ngayon, gusto naming makuha ang mga natatanging halaga sa column na 'Subj' ng 'pandas' DataFrame. Para sa layuning ito, ginagamit namin ang 'natatanging()' na paraan dito at idinaragdag namin ang pangalan ng column at pati na rin ang pangalan ng DataFrame tulad ng ipinapakita sa ibaba. Idinagdag namin ang pamamaraang ito sa 'print()' upang ang resulta ay lalabas din sa terminal.



Ngayon, pinindot namin ang 'Shift+Enter' para makuha ang resulta ng code na ito at nagre-render ito sa terminal at ipinapakita rin dito, na naglalaman ng DataFrame kasama ang lahat ng value. Ito ang orihinal na DataFrame na idinagdag namin sa code at sa ibaba nito ay ipinapakita ang mga natatanging halaga ng column na 'Subj'. Ibinababa nito ang mga duplicate na value at ipinapakita ang mga natatanging value ng column na 'Subj' ng DataFrame.

Halimbawa # 02

Ginagawa namin ang 'Sample_list' na naglalaman ng ilang impormasyon. Ipinasok namin ang 'Layla, 21, 28, 31, 14, at 39' na lalabas bilang unang column kapag na-convert namin ang listahang ito sa DataFrame. Pagkatapos, idinaragdag namin ang 'Lusy, 31, 25, 34, 26, at 21' bilang pangalawang row ng DataFrame. Pagkatapos nito, mayroon tayong 'Peter, 38, 20, 20, 35, at 24' at 'Layla 38, 23, 39 24, 23' na magiging ikatlo at ikaapat na hanay ng DataFrame. Naglalagay din kami ng tatlo pang data na 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' at 'Peter, 21, 21, 31, 21, 29' .

Ngayon, kino-convert namin ang 'Sample_list' sa 'DF_Sample' na siyang pangalan ng DataFrame dito sa pamamagitan ng paglalagay ng function na 'pd.DataFrame()'. Gayundin, itinakda namin ang pangalan ng mga column ng DataFrame na ito at ang mga pangalang ito ay 'Pangalan, Ass_1, Ass_2, Ass_3, Ass_4, at Ass_5'. Pagkatapos, ginagamit namin ang 'print()' na tumutulong sa pagpapakita ng DataFrame 'DF_Sample'. Ngayon, gumagamit kami ng isa pang paraan sa halimbawang ito para sa pagkuha ng mga natatanging halaga sa column ng DataFrame. Ang pamamaraang ito ay ang 'drop_duplicates()' na paraan ng 'pandas'.

Sa pamamaraang 'drop_duplicates()', itinakda namin ang pangalan ng column kung saan gusto naming makuha ang mga natatanging value sa column ng DataFrame. Nakakakuha kami ng mga natatanging value ng column na “Pangalan” sa pamamagitan ng pag-drop sa mga duplicate na value sa column na ito sa tulong ng pamamaraang “drop_duplicates()” at i-render din ang mga natatanging value na ito gamit ang function na “print()” dito.

Ang mga pangalan na nadoble ay ibinabagsak at ang mga natatanging halaga ay nai-render pagkatapos ilapat ang 'drop_duplicates()' na paraan. Maaari mong tandaan na ang pangalang 'Layla' ay lumalabas sa tatlong mga cell ng column na 'Pangalan'. Ngunit kapag ang 'drop_duplicates()' na paraan ay inilapat sa column na ito, ang lahat ng mga duplicate na halaga ay ibinabagsak at isang 'Layla' na pangalan ang lumabas sa screen. Pagkatapos i-drop ang mga duplicate na value, lumabas ang bagong DataFrame na naglalaman ng mga natatanging value sa column na 'Pangalan' na ito. Sa ganitong paraan, maaari nating i-drop ang mga duplicate na value at makuha ang natatanging value sa column ng DataFrame sa tulong ng pamamaraang 'drop_duplicates()'.

Halimbawa # 03

Ang parehong DataFrame ay ginamit muli at ngayon ay inilalapat namin ang 'natatanging()' na pamamaraan dito. Sa pamamaraang 'natatangi()' inilalagay namin ang pangalan ng column pati na rin ang pangalan ng DataFrame kung saan gusto naming ilapat ang pamamaraang ito na 'natatangi()' para sa pagkuha ng mga natatanging halaga. Ire-render lang nito ang mga natatanging value ng column na iyon at hindi ipapakita ang mga value na ito sa anyo ng DataFrame.

Dito, naglalaman ang DataFrame ng pitong value sa column na “Pangalan” ngunit kapag inilapat natin ang pamamaraang “natatangi()” sa column na ito, apat na value lang ang lumitaw at ito ang mga natatanging value ng column na iyon. Hindi ito nagre-render ng mga duplicate na value.

Halimbawa # 04

Ang DataFrame na nilikha namin sa halimbawang ito ay ang 'F_G_df'. Inilalagay namin ang 'My_fruits' at 'my_Vegs' sa DataFrame na ito. Ang column na 'My_fruits' ay naglalaman ng 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear, at Apple'. Next, we have the “My_Vegs” which contains the names of the vegetables which are “Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic, and Ginger”. Ang DataFrame na ito ay naglalaman lamang ng dalawang column.

Ngayon, nakukuha namin ang mga natatanging value sa parehong column  sa tulong ng 'natatangi()' na paraan. Binabanggit namin ang pangalan ng DataFrame. Pagkatapos, ilagay ang column sa unang pangalan ng column. Pagkatapos nito, ginagamit namin ang append() na paraan. Sa append na ito, muli naming inilalagay ang pangalan ng DataFrame at ang pangalawang pangalan ng column at inilalagay ang 'natatanging()' na paraan. Makukuha nito ang mga natatanging value ng parehong column at pagkatapos ay idaragdag ang mga natatanging value ng parehong column at lalabas ang mga ito sa screen.

Ang DataFrame ay unang nai-render na naglalaman ng lahat ng mga halaga. Pagkatapos nito, ang 'natatangi()' na paraan ay inilapat at ang mga natatanging halaga ng parehong mga column ay nai-render sa ibaba. Sa code na ito, nakukuha namin ang mga natatanging value sa maraming column ng DataFrame sa pamamagitan ng paggamit ng 'unique()' na paraan.

Konklusyon

Ang buong paliwanag sa pagkuha ng mga natatanging halaga sa column ng DataFrame ay matatagpuan sa gabay na ito. Tinalakay namin ang mga pamamaraang 'natatangi()' at 'drop_duplicates()' na tumutulong sa amin sa pagkuha ng mga natatanging halaga ng column ng DataFrame. Ginalugad namin kung paano gamitin ang mga pamamaraang ito sa code ng 'pandas' sa pamamagitan ng paggamit ng mga pamamaraang ito dito sa aming mga code. Naglarawan kami ng iba't ibang halimbawa sa gabay na ito at ipinakita sa iyo kung paano makuha ang mga natatanging halaga ng isang column sa pamamagitan ng paggamit ng 'natatangi()' na paraan pati na rin ang 'drop_duplicates()' na paraan. Ginalugad din namin kung paano makuha ang mga natatanging halaga sa maraming column sa pamamagitan ng paggamit ng 'natatangi()' na paraan sa gabay na ito.