Pandas Reindex

Pandas Reindex



'Sa 'pandas,' maaari kaming mag-imbak ng maraming impormasyon sa tabular form, na kilala rin bilang DataFrame. Pinapadali tayo ng 'pandas' gamit ang pamamaraang 'DataFrame()' para sa pagbuo ng DataFrame. Ang DataFrame ay naglalaman ng mga index, at maaari rin naming baguhin ang mga index ng DataFrame sa pamamagitan ng paggamit ng mga function na 'pandas'. Ang paraan na ginagamit namin para sa muling pag-index ng DataFrame ay ang 'reindex()' na paraan. Nakakatulong ang paraang ito sa pagbabago ng mga value ng index ng row pati na rin ang mga value ng index ng mga column. Sa pamamagitan ng paggamit ng paraang ito, maaari naming baguhin ang default na index ng DataFrame, at gayundin, maaari naming baguhin ang index na itinakda namin habang ginagawa ang DataFrame. Gagamitin namin ang 'reindex()' na paraan sa aming mga halimbawa ng 'pandas' sa tutorial na ito at ipapaliwanag ang konseptong ito ng malalim dito.'

Halimbawa # 01

Ang tool na 'Spyder' ay tumutulong sa amin sa pagbuo ng 'pandas' code dito sa tutorial na ito, at sinisimulan namin ang aming code gamit ang keyword na 'import,' na makakatulong sa pag-import ng 'pandas' function. Inilalagay namin ang 'pandas bilang pd' pagkatapos i-type ang 'import'. Pagkatapos nito, ginagawa namin ang DataFrame sa pamamagitan ng pag-type ng 'pd.DataFrame()'. Isinulat namin ang 'pd' dito dahil ang 'DataFrame()' ay ang paraan ng 'pandas'. Ang 'value_df' ay ang pangalan ng variable kung saan naka-save ang DataFrame. Nagdagdag kami ng 'RandomName,' na siyang pangalan ng column, at ang 'RandomName' ay naglalaman ng 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander, at Samuel.'







Pagkatapos, mayroon kaming 'Value_1,' kung saan inilagay namin ang '16, 29, 24, 35, 44, 50, 69, 74, at 88'. Pagkatapos ay darating ang 'Value_2,' at idinagdag namin ang '25, 38, 42, 56, 54, 65, 78, 89, at 99'. Ngayon, ang 'Value_3' ay susunod, at inilalagay namin ang '36, 48, 52, 69, 74, 75, 87, 91, at 69' dito. Ang column na 'Value_4' ay naroroon pagkatapos nito, kung saan inilagay namin ang '52, 64, 72, 88, 82, 95, 97, 21, at 39'. Ang huling column ay ang column na “Value_5” dito, at sa column na ito, ang mga value na idinagdag namin ay “66, 78, 82, 99, 34, 45, 57, 61, at 89”. Pagkatapos nito, ginagamit namin ang function na 'print()' kung saan idinaragdag ang 'Values_df'. Ito ay magpi-print sa terminal.




Pagkatapos pindutin ang “Shift+Enter”, madali naming makukuha ang resulta ng aming mga code sa “Spyder” app. Dito, ibinabalik ng code na ito ang DataFrame na may default na index. Ngayon, ilalapat namin ang 'reindex()' na paraan para sa muling pag-index ng DataFrame na ito sa 'pandas'.




Ang function na 'reindex()' ay ginagamit dito para sa muling pag-index ng index value ng row. Sa DataFrame sa itaas, makikita mo na ang mga default na index value ng row ay ipinapakita, at ngayon, inilalapat namin ang 'reindex()' na paraan para sa muling pag-index ng mga row index na iyon. Inilalagay namin ang pangalan ng DataFrame at pagkatapos ay ang 'reindex()' na paraan kung saan inilalagay namin ang mga halaga ng index na gusto naming idagdag sa DataFrame sa itaas. Inilalagay namin ang 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H, at ind_I' sa function na 'reindex()'. Kaya, ang mga index ng row na ito ay maa-update sa DataFrame kapag isinagawa namin ang code na ito.






Ang mga halaga ng index ng row ay ipinapakita sa kinalabasan na ito, at maaari mong tandaan na ang mga halaga ng DataFrame ay hindi ipinapakita dito, at ang mga halaga ng 'NaN' ay lumitaw. Ito ay dahil ang mga bagong halaga ng index ay hindi tumutugma sa mga dating halaga ng index ng DataFrame. Kapag hindi nagtugma ang bagong index at lumang index, ipapakita nito ang 'Nan' doon. Ang mga value na 'NaN' na ito ay lumalabas bilang default kapag binago namin ang index, at hindi ito tumutugma sa nakaraang index.



Halimbawa # 02

Binabago namin ngayon ang mga value ng column index ng 'Value_df,' na dati naming ginawa sa halimbawa 1. Pagkatapos i-print ang 'Value_df', inilalagay namin ang variable na 'column' at nagdagdag ng ilang value dito. Nagdaragdag kami ng 'a_1, b_1, c_1, d_1, at e_1'. Ngayon, gusto naming ayusin ang mga halagang ito bilang index ng mga column, kaya, para dito, ginagamit namin ang 'reindex()' na paraan at ilagay ang pangalan ng variable na 'column' kung saan naka-imbak ang mga bagong value ng index ng column at itakda din ang 'axis' sa 'columns' kaya, ia-update nito ang column axis index. Inilalagay namin ang 'reindex()' na paraan sa 'print()', kaya ito ay magre-render din sa terminal.


Habang ginamit namin ang 'reindex()' na paraan, ang mga value ng column index na nasa unang DataFrame ay ina-update, at ang mga bagong value ay idinaragdag sa na-update na DataFrame. Maaari mo ring tandaan na ang lahat ng mga halaga ng DataFrame ay na-convert sa 'NaN' dahil ang parehong mga halaga ng index ng mga column ay magkaiba.

Halimbawa # 03

Ang “Programming_data” sa code na ito ay naglalaman ng “P_Languages,” kung saan idinagdag namin ang “JavaScript, CSS, Web Engineering, OOP, C#, AI, Java, at JavaScript”. Pagkatapos, mayroon tayong 'Oras' kung saan inilalagay natin ang '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs, at 6_hrs'. Pagkatapos nito, ang 'P_Code' ay ipinasok, at ipinasok namin ang '11523, 12423, 12321, 11456, 11454, 12267, 13106, at 14123'. Idinaragdag namin ang variable na 'p_index' at inilalagay namin ang 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G, at Pro_H'.

Gagamitin ang mga value na ito bilang mga index value ng mga row. Binago namin ang 'Programming_data' sa 'Programming_df' DataFrame. Idinaragdag din namin ang 'p_index' sa DataFrame na ito sa pamamagitan ng paggamit ng 'index' na paraan. Inilalagay namin ang 'Programming_df' at pagkatapos ay ang 'index' na paraan at italaga ang 'p_index' dito. Ngayon, ang mga halaga ng index sa itaas ay idinagdag bilang mga halaga ng index ng mga hilera sa DataFrame. Ini-print din namin ang 'Programming_df'.

Pagkatapos nito, nagdagdag kami ng ilang bagong index value sa variable na 'new_index', at ito ay 'P_1, P_2, P_3, P_4, P_5, P_6, P_7, at P_8'. Dahil gusto naming i-update ang mga halaga ng index ng mga row, ginagamit namin ang 'reindex()' na paraan at inilalagay ang 'new_index' bilang parameter ng function na ito at iniimbak din ang na-update na DataFrame sa 'newProgramming_df' at ilagay ang 'newProgramming_df' sa ' print()” para sa pagpapakita.


Ang mga halaga ng index ay ina-update, at maaari rin naming sabihin na na-reindex namin ang DataFrame na aming nilikha. Ang lahat ng mga halaga ng DataFrame ay na-convert din sa 'NaN' dahil ang parehong mga halaga ng index ay magkaiba.

Halimbawa # 04

Kasalukuyan naming binabago ang mga value ng index ng 'Programming_df's' ng mga column, na dati naming binuo sa halimbawa 3. Inilalagay namin ang variable na 'column' at naglalagay ng mga bagong value dito. Ang “P_Code, P_Languages, Hours, at New” ay idinaragdag sa variable na “column”. Pagkatapos, muli naming ginagamit ang pamamaraang 'reindex()' kung saan itinakda namin ang variable na 'column', na mag-a-update sa mga dating value ng index ng column at idagdag ang mga bagong value ng index ng column na ito sa DataFrame.

Dito, mapapansin mo na ang mga bagong value na idinagdag namin sa 'column' ay kapareho ng idinagdag namin sa DataFrame sa itaas, ngunit iba ang pagkakasunud-sunod, kaya babaguhin nito ang pagkakasunud-sunod ng mga column at isasaayos ang lahat ng column habang kami binanggit sa variable na 'column'. Gayundin, nagdaragdag kami ng isa pang index value na wala sa DataFrame sa itaas, na 'Bago' dito, kaya lalabas ang mga value ng 'NaN' sa column na ito.


Ang pagkakasunud-sunod ng mga column ay binago dito, at ang lahat ng mga value ay lumilitaw habang ito ay naroroon sa orihinal na DataFrame's column at ang 'Bago' na column sa na-update na DataFrame ay naglalaman ng lahat ng 'NaN' na halaga dahil ang column na ito ay wala sa orihinal na DataFrame.

Konklusyon

Iniharap namin ang tutorial na ito na tumutulong sa amin sa pag-unawa sa konsepto ng 'pandas reindex' nang detalyado. Napag-usapan namin kung paano namin mai-reindex ang column ng DataFrame pati na rin ang mga value ng index ng row. Ipinaliwanag namin na ang function na 'reindex()' ng 'pandas' ay ginagamit para sa paggawa nito. Nakagawa kami ng iba't ibang mga halimbawa kung saan binago namin ang mga halaga ng index ng mga hilera ng DataFrame at gayundin ang mga halaga ng index ng index ng column ng DataFrame. Nai-render namin ang mga resulta ng lahat ng mga code na ginawa namin dito sa tutorial na ito at ipinaliwanag din ang mga ito nang malalim.