Pandas DataFrame Sa JSON

Pandas Dataframe Sa Json



Ang 'pandas' ay nagbibigay ng pasilidad para sa pagmamanipula ng data pati na rin sa pagsusuri ng data. Sa modernong mundo, ang pagsusuri ng data ay isang napakahalagang tool. Upang makumpleto ang gawaing ito, ang iba't ibang istruktura ng data ay magagamit sa computer science. Sa 'pandas,' mayroon kaming DataFrame, na na-convert din sa 'JSON.' Maaari naming ipaliwanag ang 'JSON' dahil isa itong text na gumagamit ng mga notasyon ng JavaScript Object. Ang paglipat ng data sa mga server at web app ay gumagamit ng 'JSON'. Sa gabay na ito, susuriin namin ang JSON format conversion ng DataFrames. Para sa conversion na ito mula sa DataFrame patungo sa 'Json', ang 'pandas' ay nagbibigay ng 'to_json()' na paraan. Sa tuwing kailangan naming i-convert ang DataFrame sa 'JSON' na format, ginagamit namin ang 'to_json()' na paraan ng 'pandas'. Para mas maunawaan kung paano gamitin ang function ng 'pandas' na 'to_json', tingnan natin ang ilang code ng 'pandas' dito sa gabay na ito.'

Halimbawa # 01
Ipapakita namin sa pagsasanay kung paano gamitin ang 'to_json()' na paraan ng 'pandas' para sa pagbabago ng 'pandas' DataFrame sa JSON na format. Ang package na 'pandas' ay na-import dito, na siyang 'numpy,' at ini-import namin ito bilang 'np'. Ngayon, upang maisagawa ang 'pandas' code, dapat na ma-import ang mga pakete ng panda. Para i-import ang package na iyon, ginagamit namin ang keyword na 'import'. Pagkatapos, itinakda namin ang 'pandas bilang pd,' na nangangahulugan na madali naming ma-access o magamit ang anumang 'pandas package' na kailangan namin sa pamamagitan lamang ng paglalagay ng 'pd' doon.

Lumilikha kami ng numpy array dito sa pamamagitan ng paggamit ng 'np. array', ang 'np' na ito ay tumutulong sa amin sa pag-access sa mga function ng numpy library. Ang numpy array na ito ay nakaimbak din sa variable na 'New_data', at inilalagay namin ang 'A, B, C, D' at 'E, F, G, H' sa numpy array na ito. Ang numpy array na ito ay na-convert na ngayon sa DataFrame sa pamamagitan ng paggamit ng 'pd.DataFrame' na paraan. Ito ang paraan ng 'pandas' na ina-access namin dito sa pamamagitan ng paglalagay ng 'pd'. Kapag na-convert namin ang numpy array na ito sa DataFrame, inilalagay din namin ang mga pangalan ng column.







Ang mga pangalang idinaragdag namin dito bilang mga header ng column ay 'col1, col2, col3, at col4.' Pagkatapos ay makikita mo na mayroon kaming 'print' sa ibaba kung saan itinakda namin ang pangalan ng DataFrame, na sa kasong ito ay 'New_dataFrame', kaya ito ay ire-render sa pagpapatupad ng code na ito. Ngayon, kino-convert namin ang DataFrame na ito sa JSON na format sa pamamagitan ng paggamit ng 'to_json()' na paraan. Itinakda namin ang pangalan ng DataFrame na 'New_dataFrame' na may 'to_json()' na paraan at inilalagay din ang pamamaraang ito sa variable na 'New_json'. Dito, hindi kami nagpasa ng anumang parameter sa pamamaraang ito na 'to_json()'. Ang JSON na format ng DataFrame ay inilagay na ngayon sa 'print' at ito ay magre-render din sa console.





Para sa compilation at execution ng code na ito, pinindot namin ang 'Shift+Enter' at kung ang code ay walang error, ang output ay magre-render. Dito rin namin i-paste ang kinalabasan ng code na ito kung saan ipinakita namin ang DataFrame na aming ginawa sa halimbawang ito at gayundin ang JSON na format ng DataFrame na iyon.





Halimbawa # 02
Dito, nag-i-import lamang kami ng isang library, na kung saan ay ang mga 'pandas' at pagkatapos ay ang listahan ng 'AtoZ_Courses' ay nilikha, at naglalagay kami ng ilang mga listahan dito, na 'Python, 29000, 35 araw, at 1000.0', pagkatapos ay inilalagay namin ang ' JavaScript, 27000, 55 araw, at 2300.0', pagkatapos nito, idinaragdag namin ang 'HTMLCSS, 25000, 25 araw, at 1500.0'. Ngayon, naglagay din kami ng dalawa pang data bilang 'DataBase, 24000, 45 araw, at 1500.0', at 'OOP, 21000, 35 araw, 1500.0' din. Ang listahan ng 'AtoZ_Courses' ay binago na ngayon sa DataFrame, at pinangalanan namin itong 'AtoZ_Courses_df'. Ang “Courses_Name, Payment, Duration, and Bonus” ay idinaragdag dito bilang mga pangalan ng column ng DataFrame.



Ngayon, ang DataFrame ay nabuo sa hakbang na ito, at idinaragdag namin ito sa 'print()' na pahayag para sa pagpapakita nito sa terminal. Ngayon, gamit ang 'to_json()' na paraan, binabago namin ang 'AtoZ_Courses_df' DataFrame sa JSON na format. Ang pamamaraang “to_json()” na ito ay binibigyan din ng parameter na “orient= column,” na siyang default na parameter din. Ipinapakita nito ang DataFrame bilang dict bilang '{column name -> {index value -> column value}} format'.

Dito, sa JSON format, ipinapakita nito ang pangalan ng column at pagkatapos ay inilalagay ang lahat ng value ng column na iyon kasama ng index value. Una, binanggit nito ang pangalan ng unang column, at pagkatapos ay ire-render ang lahat ng value ng unang column kasama ng mga index value, at pagkatapos ay inilalagay nito ang pangalawang pangalan ng column at lahat ng value ng pangalawang column na may mga index at iba pa.

Halimbawa # 03
Ang DataFrame ay nabuo sa code na ito na may pangalang 'Bachelors_df'. Naglagay kami ng limang column sa “Bachelors_df” na ito. Ang unang column na mayroon kami dito ay ang column na 'Estudyante', at inilalagay namin ang 'Lily, Smith, Bromley, Milli, at Alexander' dito. Ang column na susunod ay ang column na 'Degree', na naglalaman ng 'IT, BBA, English, CS, at DVM.' Pagkatapos ay darating ang 'taon_ng_pagsali' kung saan idinaragdag namin ang mga taon ng pagsali ng mga mag-aaral, na '2015, 2018, 2017, 2015, at 2014'.

Ang column sa tabi ng column na ito ay “year_of_graduation”, na naglalaman ng graduation years ng mga estudyanteng iyon ay “2019, 2022, 2021, 2019, at 2018”. Idinagdag din namin ang column na 'CGPA' dito kung saan inilalagay namin ang mga CGPA ng mga mag-aaral na '3.3, 3.5, 3.6, 3.7, at 3.8'. Upang ipakita ang 'Bachelors_df' sa terminal, isasama namin ito sa expression na 'print()'. Ngayon, kino-convert namin ang ” Bachelors_df ” DataFrame sa JSON format gamit ang “to_json()” na paraan.

Ang parameter na 'orient= records' ay ipinapasa din sa pamamaraang ito na 'to_json()' sa code na ito. Ipapakita ng “orient= records” na ito ang JSON format bilang “[{column name -> column value}, … , {column name -> column value}]” form. Ang format ng JSON ng DataFrame ay nakatakda na ngayon sa 'i-print,' at ipapakita rin ito sa terminal.

Ang DataFrame ay ipinapakita lamang dito sa mga column at row form, ngunit sa JSON na format, mapapansin mong inilalagay nito ang pangalan ng column at pagkatapos ay ipinapakita ang halaga ng column na iyon; pagkatapos ipakita ang halaga ng isang column, ipi-print nito ang pangalan ng pangalawang column at pagkatapos ay ilagay ang halaga ng column na iyon at pagkatapos ay dahil itinakda namin ang parameter ng 'to_josn' na paraan bilang 'orient= records'.

Halimbawa # 04
Lumilikha kami ng isang numpy array na 'My_data' kung saan ipinasok namin ang '2, 4' at '6, 8'. Pagkatapos ay baguhin ang numpy array sa DataFrame 'My_dataFrame' at itakda ang mga pangalan ng column nito bilang 'A1 at A2'. Ngayon, pagkatapos ipakita ang DataFrame dito sa pamamagitan ng paggamit ng 'print'. Ginagamit muna namin ang 'to_json()' na paraan nang walang anumang mga parameter at ipinapakita ito. Pagkatapos nito, itinakda namin ang parameter na 'to_json()' sa 'orient=split' at i-print din ang format na ito. Pagkatapos ay inilapat namin muli ang 'to_josn()' sa 'My_dataFrame' at sa pagkakataong ito, ipinapasa namin ang 'orient=records' bilang parameter ng function na ito.

Sa ibaba nito, inilalagay namin ang 'orient= index' kasama ang 'My_dataFrame' at i-render ang JSON na format na ito. Pagkatapos ng parameter na ito, muli naming ginagamit ang 'to_json' na may parameter na 'orient = column' at i-render din ito. Pagkatapos ay ipinapasa namin ang 'orient= values' bilang parameter ng 'to_json()' na paraan at ilapat ito sa 'My_dataFrame'. Itinakda din namin ang parameter ng function na ito sa 'orient= table' at muli itong gamitin sa parehong DataFrame at ipinapakita din ang JSON na format na ito. Ngayon, mapapansin natin ang pagkakaiba sa pagitan ng mga format ng JSON sa output ng code na ito.

Dito, madali mong mahahanap ang pagkakaiba sa pagitan ng mga format ng JSON, na inilapat namin sa parehong DataFrame. Ang lahat ng mga parameter na ipinasa namin sa pamamaraang 'to_json' ay lilitaw sa iba't ibang mga format dito.

Konklusyon

Ipinapakita ng gabay na ito ang JSON format at ipinaliwanag ang JSON format na ito nang detalyado at kung paano i-convert ang mga pandas DataFrame sa JSON. Ipinaliwanag namin na ang 'to_json()' na paraan ay ginagamit para sa pag-convert ng mga pandas DataFrame sa JSON na format. Napag-usapan din namin ang iba't ibang mga parameter, na ipinasa namin sa pamamaraang 'to_json()' dito. Nagbigay kami ng kumpletong gabay kung saan ginamit namin ang mga pamamaraang 'to_json()' sa pamamagitan ng paglalagay ng lahat ng posibleng parameter sa pamamaraang ito ng 'to_json()' sa aming code na 'pandas' at ipinakita rin ang mga ito sa output kung paano binabago ng mga parameter na ito ang format ng JSON.