Pandas Series hanggang CSV

Pandas Series Hanggang Csv



Ang 'Series.to_csv()' na paraan sa Pandas ay naglalabas ng tinukoy na object ng serye sa isang comma-separated values ​​(csv) notation. Kinukuha lang ng function na ito ang mga value mula sa isang serye at binabago ang kanilang format sa pamamagitan ng pagdaragdag ng mga kuwit para sa paghihiwalay ng mga halaga ng index at column.

Upang gamitin ang function na ito, kailangan nating gamitin ang sumusunod na syntax:









Ang artikulong ito ay magbibigay sa iyo ng dalawang magkaibang pamamaraan upang matutunan ang mga paraan upang gamitin ang paraang ito sa isang python program.



Halimbawa # 1: Paggamit ng Series.to_csv() na Paraan para I-convert ang isang Serye na May DatetimeIndex sa Comma-Separated Values

Upang baguhin ang isang serye sa isang CSV na format, gagamitin namin ang function na 'Series.to_csv()'. Ang paglalarawang ito ay bubuo ng isang serye na may DatetimeIndex at pagkatapos ay i-convert ito sa isang comma-separated values ​​format.





Para sa paglalagay ng pamamaraang ito sa pagpapatakbo, dapat tayong magkaroon ng tool na sumusuporta sa python programming. Ang tool na 'Spyder' ay napili para sa pag-compile ng mga code. Upang isulat ang script dito, inilunsad muna namin ang naka-install na tool sa aming system. Ang programa ng python ay nangangailangan ng isang aklatan upang magamit ang mga pamamaraan nito para sa pagkamit ng kinakailangang resulta. Ang library na na-load namin dito ay ang 'Pandas'. Sa parehong linya ng code, ang alias ng library na ito ay kinilala bilang 'pd.' Kaya, saanman sa programa, kailangan nating magsulat ng 'pandas' upang ma-access ang isang function. Sa halip ay isusulat namin ang 'pd'.

Ang unang hakbang sa pagsisimula sa code ay ang pagbuo ng serye ng Pandas. Kailangan nating magsulat ng 'pd' upang gamitin ang paraan ng paglikha ng serye mula sa mga panda. Ang function na 'pd.Series()' ay tinatawag upang bumuo ng isang serye na may mga tinukoy na halaga. Ang mga halagang ibinigay namin para sa serye ay 'Istanbul', 'Izmir', 'Ankara', 'Ankara', 'Antalya', 'Konya', at 'Bursa'. Kung gusto mong bigyan ng pangalan ang hanay ng mga value na ito, magagawa mo ito sa pamamagitan ng paggamit ng parameter na 'pangalan'. Dito, pinangalanan namin ang hanay ng mga halagang ito na 'Mga Lungsod' dahil hawak nito ang mga pangalan ng 6 na lungsod. Upang iimbak ang seryeng ito, isang serye na bagay na 'Turkey' ang ginawa.



Upang lumikha ng DatetimeIndex, ginamit namin ang 'pd.date_range()' na paraan. Sa pagitan ng mga panaklong ng function na ito, nakapasa kami ng 4 na argumento na: 'start', 'freq', 'periods', at 'tz'.

Ang argumentong 'pagsisimula' ay tumatagal ng isang petsa at oras upang simulan ang pagbuo ng hanay ng petsa mula dito. Dito, tinukoy namin ang petsa at oras ng pagsisimula bilang '2022-03-02 02:30'. Ang parameter na 'freq' ay inuuri ang dalas para sa hanay ng petsa. Kaya, ibinigay namin ito sa halagang 'D'. Ngayon, lilikha ito ng hanay ng petsa sa pang-araw-araw na dalas. Ang argument na 'panahon' ay nakatakda sa '6' na nangangahulugang bubuo ito ng hanay ng petsa para sa 6 na araw. Ang huling parameter ay 'tz' na tumutukoy sa timezone para sa tinukoy na lugar. Tinukoy namin ang time zone para sa “Asia/Istanbul”.

Upang iimbak ang hanay ng petsa na ito, gumawa kami ng variable na variable na 'Datetime'. Upang itakda ang DatetimeIndex, ginamit namin ang property na 'Series.index.' Ang pangalan ng seryeng 'Turkey' ay ibinibigay kasama ng '.index' na property at itinalaga dito ang hanay ng oras ng petsa na nakaimbak sa variable na 'Datetime.' Kaya, kukunin ng property na 'index' ang mga value mula sa variable na 'Datetime' at gagawin silang listahan ng index ng seryeng 'Turkey'. Panghuli, upang tingnan ang serye ng output, ginamit namin ang pamamaraang 'print()' at ipinasa ang seryeng 'Turkey' bilang input dito upang ipakita ang nilalaman nito.

Pinindot lang namin ang opsyong 'Run file' para maisagawa ang script. Dahil dito, makakakita tayo ng serye na may DatetimeIndex simula sa “2022-03-02 02:30:00+03:00” at nagtatapos sa “2022-03-07 02:30:00+03:00″ na lumilikha ng tuldok ng 6 na araw. Sa ibaba ng serye ay binanggit din ang 'Freq :D', ang pangalan ng array list na 'Mga Lungsod' at ang dtype na 'object'.

Ngayon, matututunan nating i-convert ang seryeng ito na nakita lang natin sa snapshot sa itaas sa isang CSV na format. Upang baguhin ang serye sa mga halagang pinaghihiwalay ng kuwit, mayroon kaming paraan na ibinigay ng module ng pandas na 'Series.to_csv()'. Kinukuha ng pamamaraang ito ang mga halaga ng ibinigay na serye at nagdaragdag ng mga kuwit sa pagitan ng mga halaga ng column.

Tinatawag ang function na 'Series.to_csv()'. Ang pangalan ng serye na gusto naming i-convert ay binanggit sa pamamaraan bilang 'Turkey.to_csv()'. Upang mapanatili ang mga halagang pinaghihiwalay ng kuwit, gumawa kami ng variable na 'Comma_Separated' at pagkatapos ay ilagay ang nilalaman nito sa output window sa pamamagitan ng paggamit ng function na 'print()'.

Narito ang aming serye sa format na csv. Makikita natin sa snapshot na ang index at ang mga halaga ng serye ay pinaghiwalay gamit ang mga kuwit sa mga ito.

Halimbawa # 2: Paggamit ng Paraan ng Series.to_csv() para I-convert ang isang Serye na May Mga Halaga ng NaN sa Mga Halagang Pinaghihiwalay ng Kuwit

Ang pangalawang pamamaraan para gamitin ang pamamaraang 'Series.to_csv()' ay ang paglalapat ng paraang ito upang i-convert ang isang serye na may hawak na ilang null na entry sa isang CSV na format.

Una naming na-import ang mga kinakailangang pakete. Ang 'pd' ay ginawang alyas para sa mga panda at 'np' bilang alyas para sa numpy. Ang numpy toolkit ay na-load dito dahil gagawa kami ng ilang null na entry sa aming serye gamit ang 'np.NaN' habang ginagawa ito gamit ang pandas na 'pd.Series()' na paraan.

Ang function na 'pd.Series()' ay ginagamit para sa pagbuo ng isang pandas series na may mga value na ito: 'Nile', 'Amazon', np.NaN, 'Ganges', 'Mississippi', 'np.NaN', 'Yangtze', “Danube”, “Mekong”, “np.NaN”, at “Volga”. Mayroong kabuuang 21 value na tinukoy para sa serye kung saan 3 entry ang may hawak na mga value na 'np.NaN' na nangangahulugang 3 value ang nawawala sa serye. Tinutukoy ng property na 'pangalan' ang pangalan para sa hanay ng mga value na ito na ibinigay namin ng 'Mga Pamagat.' Ginagamit ang property na 'index' upang itakda ang listahan ng index na tinukoy ng user sa halip na pumunta sa default na listahan.

Dito, gusto namin ang listahan ng index na may mga value na '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', at 21'. Ngayon, ang aming serye ay magkakaroon ng listahan ng index simula sa '10' sa halip na '0'. Ngayon, itabi ang seryeng ito para magamit namin ito sa susunod sa programa. Nagsimula kami ng isang seryeng object na 'Rivers' at inilaan ito ang output series na nabuo mula sa pagtawag sa 'pd.Series()' na paraan. Ang serye ay makikita sa pamamagitan ng paglalagay nito sa display gamit ang 'print()' function ng python.

Ang nai-render na output sa terminal ay nag-print ng isang serye na ang listahan ng index ay nagsisimula sa 10 at nagtatapos sa 21 na nangangahulugan na ang serye ay may 21 na halaga.

Ang serye ay gagawing CSV na format gamit ang 'Series.to_csv()' na paraan.

Ginamit namin ang pamamaraang 'Series.to_csv()' sa aming seryeng 'Turkey'. Samakatuwid, kukunin ng paraang ito ang mga value mula sa seryeng 'Turkey' at iko-convert ang mga ito sa isang comma-separated values ​​format. Ang resulta ay naka-save sa variable na 'Converted_csv'. At sa huli, ang na-convert na serye ay naka-print sa tulong ng function na 'print()'.

Sa snapshot ng kinalabasan sa ibaba, makikita mo na ang mga halaga ng serye ay binago na ngayon sa isang paraan kung saan ginagamit ang kuwit upang ihiwalay ang mga ito sa listahan ng index. Bukod dito, kung saan nawawala ang mga value, tanging ang index number lang ang naka-print na may kuwit.

Konklusyon

Ang pagbabago ng serye ng pandas sa isang CSV na format ay isang praktikal na diskarte. Ito ay maaaring makamit sa pamamagitan ng paggamit ng pandas na “Series.to_csv()” function. Ang gabay na ito ay nagsagawa ng dalawang pamamaraan upang gamitin ang paraang ito. Sa unang paglalarawan, ginamit namin ang paraang ito upang i-convert ang isang serye na may DatetimeIndex sa isang format ng mga halagang pinaghihiwalay ng kuwit. Ginamit ng 2nd instance ang function na “Series.to_csv()”   para baguhin ang isang serye na may ilang nawawalang entry sa isang CSV na format. Ang parehong mga diskarte ay praktikal na ipinatupad gamit ang tool na 'Spyder' sa Windows operating system.