Paano Ulitin at I-visualize ang Dataset Gamit ang PyTorch?

Paano Ulitin At I Visualize Ang Dataset Gamit Ang Pytorch



Ang PyTorch ay isang deep-learning framework na nagbibigay-daan sa mga user na lumikha/magtayo at magsanay ng mga neural network. Ang isang dataset ay isang istraktura ng data na naglalaman ng isang set/koleksyon ng mga sample at label ng data. Nagbibigay ito ng paraan upang ma-access ang data sa kabuuan o gamit ang mga operasyon sa pag-index at paghiwa. Bukod dito, ang isang dataset ay maaari ding maglapat ng mga pagbabago sa data, tulad ng pag-crop, pagbabago ng laki, atbp. Ang mga user ay madaling umulit at mailarawan ang dataset sa PyTorch.

Ang write-up na ito ay maglalarawan ng paraan upang umulit at mailarawan ang isang partikular na dataset gamit ang PyTorch.







Paano Ulitin at I-visualize ang Dataset Gamit ang PyTorch?

Upang umulit at mailarawan ang isang partikular na dataset gamit ang PyTorch, sundin ang mga ibinigay na hakbang:



Hakbang 1: Mag-import ng Kinakailangang Library



Una, i-import ang mga kinakailangang aklatan. Halimbawa, na-import namin ang mga sumusunod na aklatan:





import na tanglaw
mula sa torch.utils.data import Dataset
mula sa mga dataset ng pag-import ng torchvision
mula sa torchvision.transforms import ToTensor
mag-import ng matplotlib.pyplot bilang plt


dito:

    • import na tanglaw ” nag-import ng PyTorch library.
    • mula sa torch.utils.data import Dataset ' ini-import ang klase ng 'Dataset' mula sa module na 'torch.utils.data' ng PyTorch para sa paggawa ng mga custom na dataset sa PyTorch.
    • mula sa mga dataset ng pag-import ng torchvision Ini-import ng ” ang module ng “datasets” mula sa library ng “torchvision” na nagbibigay ng mga paunang natukoy na dataset para sa mga gawain sa computer vision.
    • mula sa torchvision.transforms import ToTensor Ini-import ng ” ang pagbabagong “ToTensor” mula sa “torchvision.transforms” para sa pag-convert ng mga PIL image o NumPy arrays sa PyTorch tensors.
    • import matplotlib.pyplot bilang plt ” nag-import ng matplotlib library para sa visualization ng data:


Hakbang 2: I-load ang Dataset



Ngayon, ilo-load namin ang dataset ng FashionMNIST mula sa torchvision para sa parehong layunin ng pagsasanay at pagsubok na may mga sumusunod na parameter:

tr_data = mga dataset.FashionMNIST ( ugat = 'data' , tren =Totoo, download =Totoo, ibahin ang anyo =ToTensor ( )
)

ts_data = mga dataset.FashionMNIST ( ugat = 'data' , tren =Mali, download =Totoo, ibahin ang anyo =ToTensor ( )
)


dito:

    • FashionMNIST ” nilo-load ang FashionMNIST dataset mula sa torchvision library.
    • ugat = 'data' ” ay tumutukoy sa direktoryo kung saan iimbak o ilo-load ang dataset kung mayroon na ito. Sa aming kaso, ito ay ang 'data' na direktoryo.
    • tren ” ay nagpapahiwatig ng pagsasanay o pagsubok na dataset.
    • download=Totoo Dina-download ni ” ang dataset kung wala pa ito.
    • transform=ToTensor() ' inilalapat ang ToTensor transform upang i-convert ang mga imahe sa dataset sa PyTorch tensors:


Hakbang 3: Mga Klase ng Label sa Dataset

Susunod, gumawa ng diksyunaryo na nagmamapa ng mga indeks ng klase sa kanilang mga katumbas na label ng klase sa dataset ng FashionMNIST. Nagbibigay ito ng mga label na nababasa ng tao para sa bawat klase. Dito, nilikha namin ang ' mapped_label ” diksyunaryo at gagamitin namin ito upang i-convert ang mga indeks ng klase sa kanilang kaukulang mga label ng klase:

mapped_label = {
0 : 'T-Shirt' ,
1 : 'Pantalon' ,
2 : 'Itabi' ,
3 : 'Damit' ,
4 : 'Amete' ,
5 : 'Sandal' ,
6 : 'shirt' ,
7 : 'Sneaker' ,
8 : 'Bag' ,
9 : 'Bungong Bukong' ,
}



Hakbang 4: I-visualize ang Dataset

Panghuli, ilarawan sa isip ang mga sample sa data ng pagsasanay gamit ang 'matplotlib' library:

fig = plt.figure ( laki ng figs = ( 8 , 8 ) )
col , hilera = 3 , 3
para sa i sa saklaw ( 1 , col * hilera + 1 ) :
sample_index = tanglaw.randint ( lamang ( tr_date ) , laki = ( 1 , ) ) .item ( )
img, label = tr_data [ sample_index ]
fig.add_subplot ( hilera, col , i )
plt.title ( mapped_label [ label ] )
plt.axis ( 'off' )
plt.imshow ( img.squeeze ( ) , cmap = 'kulay-abo' )
plt.show ( )





Tandaan : Maa-access mo ang aming Google Colab Notebook dito link .

Iyon ay tungkol sa pag-ulit at pag-visualize sa nais na dataset gamit ang PyTorch.

Konklusyon

Upang umulit at mailarawan ang isang partikular na dataset gamit ang PyTorch, una, i-import ang mga kinakailangang library. Pagkatapos, i-load ang gustong dataset para sa pagsasanay at pagsubok gamit ang mga kinakailangang parameter. Susunod, lagyan ng label ang mga klase sa dataset at i-visualize ang mga sample sa data ng pagsasanay gamit ang 'matplotlib' library. Ang write-up na ito ay naglalarawan ng paraan upang umulit at mailarawan ang isang partikular na dataset gamit ang PyTorch.