Paano basahin ang excel (xlsx) file sa sawa

How Read Excel File Python



Ang .xlsx ay ang extension ng excel document na maaaring mag-imbak ng isang malaking halaga ng data sa form na tabular, at maraming uri ng arithmetic at lohikal na pagkalkula ang maaaring magawa nang madali sa isang excel spreadsheet. Minsan kinakailangan na basahin ang data mula sa excel na dokumento gamit ang Python script para sa mga layunin sa pagprograma. Maraming mga module ang umiiral sa Python upang mabasa ang excel na dokumento. Ang ilan sa mga kapaki-pakinabang na module ay xlrd , openpyxl , at pandas . Ang mga paraan upang magamit ang mga modyul na ito upang mabasa ang excel file sa Python ay ipinakita sa tutorial na ito.

Paunang kinakailangan:

Ang isang dummy excel file na may extension na .xlsx ay kinakailangan upang suriin ang mga halimbawa ng tutorial na ito. Maaari kang gumamit ng anumang mayroon nang excel file o lumikha ng bago. Dito, isang bagong file ng excel na pinangalanan benta.xlsx ang file ay nilikha gamit ang sumusunod na data. Ginamit ang file na ito para sa pagbabasa sa pamamagitan ng paggamit ng iba't ibang mga module ng sawa sa susunod na bahagi ng tutorial na ito.







benta.xlsx



Petsa ng Pagbebenta Sales Person Halaga
05/12/18 Sila Ahmed 60000
12/06/19 Me Hossain 50,000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Halimbawa-1: Basahin ang excel file gamit ang xlrd

Ang xlrd module ay hindi naka-install sa Python bilang default. Kaya, kailangan mong i-install ang module bago gamitin ito. Ang pinakabagong bersyon ng modyul na ito ay hindi sumusuporta sa excel file na may extension na .xlsx. Kaya, kailangan mong i-install ang 1.2.0 na bersyon ng modyul na ito upang mabasa ang xlsx file. Patakbuhin ang sumusunod na utos mula sa terminal upang mai-install ang kinakailangang bersyon ng xlrd .



$pipi-install xlrd== 1.2.0

Matapos makumpleto ang proseso ng pag-install, lumikha ng isang python file na may sumusunod na script upang mabasa ang benta.xlsx file gamit ang ang xlrd modyul open_workbook () ang pagpapaandar ay ginagamit sa script buksan ang xlsx file para sa pagbabasa. Naglalaman ang excel file na ito ng isang sheet lamang. Kaya ang workbook.sheet_by_index () ang pagpapaandar ay ginamit sa script na may halaga ng argumento 0. Susunod, ang pugad 'Para' ginamit ng loop upang mabasa ang mga halaga ng cell ng worksheet gamit ang mga halagang hilera at haligi. Nagamit ang dalawang pag-andar () na pag-andar sa script upang tukuyin ang laki at laki ng haligi batay sa data ng sheet. Ang cell_value () Ginamit ng pagpapaandar ang basahin ang partikular na halaga ng cell ng sheet sa bawat pag-ulit ng loop. Ang bawat patlang sa output ay ihihiwalay ng isang tab space.





# I-import ang xlrd module
import xlrd

# Buksan ang Workbook
workbook = xlrd.open_workbook('sales.xlsx')

# Buksan ang worksheet
worksheet = workbook.sheet_by_index(0)

# Iterate ang mga hilera at haligi
para saakosasaklaw(0,5):
para sajsasaklaw(0,3):
# I-print ang mga halaga ng cell sa tab space
mag-print(worksheet.cell_value(ako, j),magtapos=' t')
mag-print(')

Output:

Ang sumusunod na output ay lilitaw pagkatapos ipatupad ang script sa itaas.



Halimbawa-2: Basahin ang excel file gamit ang openpyxl

Ang openpyxl ay isa pang module ng sawa upang mabasa ang xlsx file, at hindi rin ito naka-install sa Python bilang default. Patakbuhin ang sumusunod na utos mula sa terminal upang mai-install ang module na ito bago ito gamitin.

$pipi-installopenpyxl

Matapos makumpleto ang proseso ng pag-install, lumikha ng isang python file na may sumusunod na script upang mabasa ang benta.xlsx file Tulad ng xlrd module, ang openpyxl module ay ang load_workbook () pagpapaandar upang buksan ang xlsx file para sa pagbabasa. Ang benta.xlsx Ang file ay ginagamit bilang halaga ng argumento ng pagpapaandar na ito. Ang object ng wookbook.active ay nilikha sa script upang mabasa ang mga halaga ng max_row at ang max_column ari-arian. Ang mga katangiang ito ay ginamit sa pugad para mabasa ng mga loop ang nilalaman ng benta.xlsx file Ang pag-andar ng saklaw () ay ginamit upang basahin ang mga hilera ng sheet, at ang pagpapaandar ng iter_cols () ay ginamit upang basahin ang mga haligi ng sheet. Ang bawat patlang sa output ay ihihiwalay ng dalawang mga puwang sa tab.

# Mag-import ng module ng openyxl
i-import ang openpyxl

# Tukuyin ang variable upang mai-load ang wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# Tukuyin ang variable upang mabasa ang aktibong sheet:
worksheet = wookbook.active

# Iterate ang loop upang mabasa ang mga halaga ng cell
para saakosasaklaw(0, worksheet.max_row):
para sa kasama ang saworksheet.iter_cols(1, worksheet.max_column):
mag-print(kasama ang[ako]. halaga,magtapos=' t t')
mag-print(')

Output:

Ang sumusunod na output ay lilitaw pagkatapos ipatupad ang script sa itaas.

Halimbawa-3: Basahin ang excel file gamit ang pandas

Ang module ng pandas ay hindi naka-install na tulad ng sawa tulad ng nakaraang module. Kaya, kung hindi mo ito na-install dati, kailangan mo itong i-install. Patakbuhin ang sumusunod na utos upang mai-install ang pandas galing sa terminal.

$pipi-installpandas

Matapos makumpleto ang proseso ng pag-install, lumikha ng isang python file na may sumusunod na script upang mabasa ang benta.xlsx file Ang read_excel () Ang pagpapaandar ng pandas ay ginagamit para sa pagbabasa ng xlsx file. Ang pagpapaandar na ito ay ginamit sa script upang basahin ang benta.xlsx file Ang Balangkas ng mga datos() ginamit ang pagpapaandar dito upang basahin ang nilalaman ng xlsx file sa frame ng data at iimbak ang mga halaga sa variable na pinangalanan data . Ang halaga ng data ay nai-print sa paglaon.

# Mag-import ng panda
import pandasbilangpd

# I-load ang xlsx file
excel_data = pd.read_excel('sales.xlsx')
# Basahin ang mga halaga ng file sa dataframe
data = pd.DataFrame(excel_data,mga haligi=['Petsa ng Pagbebenta','Sales Person','Halaga'])
# I-print ang nilalaman
mag-print('Ang nilalaman ng file ay: n', data)

Output:

Ang sumusunod na output ay lilitaw pagkatapos ipatupad ang script sa itaas. Ang output ng script na ito ay naiiba mula sa nakaraang dalawang halimbawa. Ang mga numero ng hilera ay nakalimbag sa unang haligi, kung saan ang halagang halaga ng hilera ay binibilang mula sa 0. Ang mga halaga ng petsa ay nakahanay sa gitna. Ang mga pangalan ng mga nagtitinda ay nakahanay nang tama. Ang halaga ay nakahanay sa kaliwa.

Konklusyon:

Ang mga gumagamit ng sawa ay kailangang gumana sa mga xlsx file para sa iba't ibang mga layunin sa pagprogram. Tatlong magkakaibang paraan upang mabasa ang xlsx file ay ipinakita sa tutorial na ito sa pamamagitan ng paggamit ng tatlong mga module ng sawa. Ang bawat module ay may iba't ibang mga pag-andar at katangian upang mabasa ang xlsx file. Tutulungan ng tutorial na ito ang mga gumagamit ng python na basahin ang xlsx file nang madali gamit ang script ng python pagkatapos basahin ang tutorial na ito.