Column ng Pandas Sum

Column Ng Pandas Sum



'Ipapakita ng artikulong ito kung paano buuin ang lahat o partikular na column sa isang Pandas DataFrame gamit ang Python. Gagamitin ang DataFrame.sum() function kasama ng ilang nakakatulong na parameter sa maraming halimbawa ng tutorial na ito.

Kapag natapos na ang tutorial na ito, maaaring alam mo kung paano:







    • Hanapin ang kabuuan ng Column ng dataframe sa Pandas.
    • Pagsasama-sama ng mga column ng dataframe
    • Magdagdag ng Mga Column sa isang Pandas Dataframe na nakakatugon sa tinukoy na Kundisyon.
    • Tukuyin ang kabuuan pagkatapos pagsama-samahin ang data ng dataframe.

Paano Tukuyin ang Kabuuan ng Mga Hanay ng Dataframe?

Ang function na 'dataframe.sum()' sa Pandas ay nagbabalik ng kabuuang kabuuan para sa tinukoy na axis. Kung ang input ay isang axis ng index, idinaragdag ng function ang mga value ng bawat column nang paisa-isa, pagkatapos ay ginagawa ang parehong para sa bawat column, na nagbabalik ng serye na nag-iimbak ng kabuuan ng data/values ​​sa bawat column. Bukod pa rito, sinusuportahan nito ang pagkalkula ng kabuuan ng dataframe sa pamamagitan ng pagbabalewala sa mga nawawalang halaga.



Syntax: DataFrame.sum(axis = Wala, skipna = Wala, level = Wala, numeric_only = Wala, min_count = 0, **kwargs)



saan,





aksis: {columns (1), index (0)}

order: Huwag pansinin ang mga halaga ng NA/null kapag kinakalkula ang resulta.



antas: Kung ang tinukoy na axis ay hierarchical (isang multi-index), bilangin sa isang partikular na antas ng index bago mag-convert sa isang Serye.

numeric_only: Ang float, int, at boolean na mga column ay katanggap-tanggap. Kung Wala, subukang gamitin ang lahat; kung hindi, numerical data lang. Para sa Serye, hindi ipinatupad.

min_count: Ang bilang ng mga posibleng halaga na kinakailangan upang makumpleto ang operasyon. Ang magiging resulta ay NA kung mayroong mas kaunting mga halagang hindi NA naroroon kaysa sa min_count.

Ibinabalik: DataFrame (kung tinukoy ang antas) o Serye.

Halimbawa # 01: Tukuyin ang Kabuuan ng isang Dataframe Column at Lahat ng Column

Nangangailangan muna kami ng dataframe na may mga wastong datatype, ibig sabihin, int, float, atbp., column o column kung saan makikita namin ang kabuuan ng data. Ang dataframe ay malilikha sa pamamagitan ng paggamit ng pd.DataFrame() function.


Nagawa namin ang kinakailangang dataframe mula sa isang python dictionary sa loob ng pd.DataFrame() function. Sa dataframe na ginawa sa itaas, mayroong apat na column na 'Pangalan', 'araw1', 'araw2', at 'araw3'. Sa apat na column, ang tatlong column ie. 'day1', 'day2', at 'day3' ay mga numerong column na may mga value ng data (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2), at (7, 4, 3, 5, 6, 2, 1, 4) ayon sa pagkakabanggit. Mahahanap lang natin ang kabuuan para sa tatlong column na ito. Ang kabuuan para sa parehong serye (i.e., isang column) at isang buong dataframe ay maaaring matukoy gamit ang sum() na paraan. Magsimula tayo sa pagtuturo kung paano buuin ang lahat ng data sa isang column ng Pandas.


Upang matukoy ang kabuuan, ginamit namin ang paraan ng sum() sa column na 'day2'. Ibinalik ng function ang sum value na 28. Katulad nito, maaari naming matukoy ang kabuuan ng bawat column ng Dataframe. Ang paggamit lamang ng sum() na paraan sa buong dataframe ay magagawa ito.


Tulad ng makikita, ang kabuuan ng column na 'day1' ay 31; para sa “day2”, ang sum value ay 28, samantalang, para sa column na “day3”, ang sum value ay 32.

Halimbawa # 02: Paggamit ng sum() Function para Magsama-sama ang Dataframe Column Values

Tulad ng nakikita mo mula sa output ng nakaraang halimbawa, hindi ibinalik ng function ang aktwal na data frame column data na bumubuo sa kabuuan. Gayunpaman, sa pamamagitan ng pagtatalaga ng pamamaraang “DataFrame.sum()”  sa isang column ng DataFrame, maa-access mo ang bawat column sa DataFrame, kasama ang column na sum. Una, gumawa kami ng isa pang dataframe para sa halimbawang ito.


Gamit ang pd.DataFrame() nalikha ang aming dataframe. Ginawa namin ang dataframe na may tatlong column: item, presyo, at buwis. Ang column item na naglalaman ng mga string values ​​(“pen”, “marker”, “ruler”, “eraser”, “pencil”, “clipboard”, “stapler”, “pins”), ang column price na nag-iimbak ng mga value (20, 15, 10, 3, 5, 30, 35, 10), at ang column na 'buwis' ay binubuo ng mga halaga (8, 5, 3, 3, 4, 10, 5, 2). Ngayon, idagdag natin ang mga halaga ng column ng presyo at buwis at iimbak ang mga resulta sa isang bagong column sa pamamagitan ng pagpapanatili sa orihinal na mga column ng dataframe.


Dahil mapapansin ito kasama ng bagong column na 'kabuuan', ang mga orihinal na column ng ibinigay na dataframe ay ibinabalik din ng function. Iniimbak ng column na 'kabuuan' ang kabuuan ng mga halaga ng mga column na 'presyo' at 'buwis' laban sa bawat data ng 'item'.

Halimbawa # 03: Paggamit ng sum() Function upang Tukuyin ang Kabuuan ng Tinukoy na Dataframe Column

Upang pagsama-samahin ang maraming column ng dataframe, maaari naming tukuyin ang isang listahan na may mga label ng mga column at pagkatapos ay ilapat ang sum() na paraan sa listahan upang mahanap ang kabuuan. Tulad ng mga nakaraang halimbawa, gagawa muna tayo ng dataframe.


Nilikha namin ang aming dataframe na may apat na column na 'mga mag-aaral', 'marks1', 'marks2', at 'marks3'. Ang column na 'mga mag-aaral' ay nag-iimbak ng data ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill'), at ang column na 'marks1' na nag-iimbak ng value (8, 9, 6, 8, 10, 7, 9, 9), samantalang ang mga column na 'marks2' at 'marks3' ay nag-iimbak ng mga numerical values ​​(6, 6, 8, 6, 7, 9, 10, 9). ) at (7, 6, 9, 7, 8, 7, 10, 10) ayon sa pagkakabanggit.


Una, gumawa kami ng list object na may mga label ng column na 'mga mag-aaral', 'marks1', at 'marks3'. Pagkatapos ang sum() na paraan ay inilapat sa listahan. Binubuo ng function ang mga value ng marks1 at marks3 column dahil hindi numeric ang column na 'students', kaya hindi mahanap ng sum() function ang sum para sa value ng column na 'students'. Naimbak namin ang kabuuan ng mga halaga ng mga column na 'marks1' at 'marks3' sa column na 'sum'.

Halimbawa # 04: Magdagdag ng Mga Column ng Pandas Dataframe na Nakakatugon sa isang Tinukoy na Kundisyon

Sa halimbawang ito, idaragdag namin ang mga halaga ng mga tinukoy na column kung natutugunan ng mga ito ang tinukoy na kundisyon.


Mayroong 5 column sa bagong likhang dataframe, ibig sabihin, 'kumpanya', 'week1_sales', 'week2_sales', 'week3_sales', at 'branches.' Ngayon, ipagpalagay natin na ayaw nating idagdag ang halaga ng huling column kapag nagdaragdag o naghahanap tayo ng kabuuan ng mga value ng ibinigay na mga hilera ng dataframe. Sabihin nating gusto lang naming idagdag ang mga value ng column na may salitang 'linggo' sa kanilang mga label. Maaaring gumawa ng pag-unawa sa listahan upang matukoy kung ang salitang 'linggo' ay nasa isang label ng hanay o wala.


Ngayon ay nakuha na namin ang mga column na may salitang 'linggo' sa kanilang mga label. Maaari naming ibuod ang mga column na naglalaman ng salitang 'linggo' gamit ang axis=1 argument sa sum() function.


Sa ganitong paraan, ligtas nating maibubuod ang data sa mga column ayon sa hilera nang hindi kasama ang anumang column na hindi natin gusto.

Halimbawa # 5: Tukuyin ang Kabuuan Pagkatapos Pagsama-samahin ang Data ng Dataframe

Mahahanap din natin ang kabuuan ng mga column ng dataframe pagkatapos pagsama-samahin ang data ng isa o higit pang column. Ang groupby() na paraan ay gagamitin upang pagpangkatin ang data sa mga kategorya sa loob ng column. Gumawa tayo ng dataframe para mapangkat natin ang data ng isa sa mga column nito.


Ngayon ay papangkatin natin ang data sa column na 'edad' at ibubuod ang mga value ng column na 'score1' at 'score2' para sa bawat kategorya ng pangkat.


Makikita natin na ang pagbubuod ng data sa dataframe pagkatapos munang pagpangkatin ang mga value ng data ayon sa edad ay nagreresulta sa column-wise sum depende sa mga pagpapangkat ng edad.

Konklusyon

Sa tutorial na ito, sinubukan naming turuan ka kung paano kalkulahin ang kabuuan sa mga dataframe gamit ang Pandas sum method. Napag-usapan namin ang row- at column-wise na pagdaragdag ng mga value sa mga halimbawa ng post na ito. Bukod pa rito, natutunan mo kung paano magdagdag ng mga column nang may kundisyon at kung paano buuin ang mga value pagkatapos pagpangkatin ang column ng dataframe. Ngayon ay maaari mong pagsama-samahin ang mga column ng dataframe o pagsama-samahin ang mga value sa loob ng column ng dataframe nang mag-isa.