Paano Gumawa ng Crawler para Kumuha ng Data Mula sa S3 Bucket?

Ginagamit ang AWS Glue para tumuklas ng data, pagsamahin ang data, pag-crawl ng data, at gumawa ng catalog ng data sa cloud. Maaaring gumawa ang user ng crawler mula sa AWS Glue na magko-crawl ng data mula sa ibinigay na pinagmulan at pagkatapos ay iimbak ito sa catalog ng data upang makakuha ng impormasyon. Kailangan lang patakbuhin ng user ang crawler at lahat ng iba pa ay isasagawa ng crawler sa loob ng ilang sandali.

Ipapaliwanag ng gabay na ito kung paano gumawa ng mga crawler para kumuha ng data mula sa S3 bucket.

Paano Gumawa ng Crawler para Kumuha ng Data Mula sa S3 Bucket?

Upang lumikha ng crawler sa AWS, bisitahin ang ' AWS Glue ” serbisyo mula sa dashboard ng Amazon:

Mag-click sa “ Mga database ” button mula sa seksyong Catalog ng Data upang lumikha ng database:

Mag-click sa “ Magdagdag ng database ” button upang simulan ang pagsasaayos:

Ipasok ang pangalan ng database at iwanan ang lahat bilang ito ay opsyonal bago mag-click sa ' Lumikha ng database 'button:

Matagumpay na nalikha ang database:

Pagkatapos nito, pumunta lang sa ' Mga crawler ” na pahina sa pamamagitan ng pag-click dito mula sa kaliwang panel:

Mag-click sa “ Lumikha ng crawler 'button:

I-type ang pangalan ng crawler at mag-click sa “ Susunod 'button:

Mag-click sa “ Magdagdag ng data source ” button upang piliin ang pinagmulan ng data:

Upang suriin ang landas kung saan naka-imbak ang data, bisitahin ang serbisyo ng S3:

Tumungo sa S3 bucket kung saan ina-upload ang data. Ang gumagamit ay maaaring lumikha isang balde at mag-upload data dito mula sa AWS S3 dashboard:

Mag-click sa “ I-browse ang S3 ” button upang piliin ang landas ng data:

Piliin ang folder na naglalaman ng data, pagkatapos ay i-click ang “ Pumili 'button:

Ang S3 path ay napili, ngayon ay mag-click sa ' Magdagdag ng S3 data source 'button:

Kapag naidagdag na ang data source, i-click lang ang “ Susunod 'button:

Idagdag ang tungkulin ng IAM at pagkatapos ay i-click ang “ Susunod 'button:

Ipasok ang target na database na ginawa nang mas maaga at pagkatapos ay i-type ang pangalan para sa talahanayan:

Piliin ang On demand na iskedyul para sa crawler at mag-click sa “ Susunod 'button:

Suriin ang crawler at mag-click sa “ Lumikha ng crawler 'button:

Matagumpay na nalikha ang crawler, i-click ang “ Takbo ” button pagkatapos piliin ito:

Aabutin ng ilang sandali upang patakbuhin ang crawler at kukuha ito ng data at gagawa ng talahanayan upang mag-imbak ng data:

Tumungo sa ' Mga mesa ” na pahina mula sa dashboard ng Glue:

Piliin ang talahanayan sa pamamagitan ng pag-click sa pangalan nito:

Ang mga detalye ng kuwento ay ipinakita na naglalaman ng metadata ng kinuhang data:

Mag-scroll pababa sa pahina at piliin ang seksyon upang tingnan ang talahanayan na naglalaman ng data:

Iyon lang ang tungkol sa paggawa ng crawler para kumuha ng data mula sa S3 bucket.

Konklusyon

Para gumawa ng crawler para kumuha ng data mula sa S3 bucket, gumawa ng database sa AWS Glue kung saan iimbak ang na-crawl na data. I-configure ang crawler mula sa Glue dashboard sa pamamagitan ng pagbibigay ng source ng data (S3 bucket) at target na database. Patakbuhin ang crawler at kunin ang data mula sa S3 bucket patungo sa talahanayan ng database dahil masusing ipinaliwanag ng gabay na ito.

Paano Gumawa ng Crawler para Kumuha ng Data Mula sa S3 Bucket?

Paano Gumawa ng Crawler para Kumuha ng Data Mula sa S3 Bucket?

Konklusyon

Kategorya

Patok Na Mga Post

Paano I-echo ang Mga Utos ng Shell habang Isinasagawa ang mga Ito sa Bash

Paano Magtakda ng Min at Max na Taas para sa Mga Breakpoint at Media Query ng Tailwind

Paano Ilapat ang Kapal ng Dekorasyon ng Teksto gamit ang Mga Tailwind Breakpoint at Mga Query sa Media

Paano Gamitin ang Mga Klase sa Imbakan ng Kubernetes

Ano ang AWS? | Amazon Web Services

Linux Diff Command

Paano Gamitin ang Listahan ng Paglalarawan sa HTML?

Ibalik ang Mga Nawawalang Shortcut sa Mga Tool sa Pamamahala sa Windows 10 - Winhelponline

Paano I-reset ang Nakalimutang Password ni Kali?

Paano Gumawa ng Multiline Equation sa LaTeX

Paano Pagbukud-bukurin ang Du ayon sa Sukat sa Linux

PowerShell Lumikha ng Folder Kung Wala

Paano Ayusin ang 'Pagtanggi na Pagsamahin ang Mga Hindi Kaugnay na Kasaysayan' sa Git?

Pagsamahin ang Dalawang Talahanayan sa SQL

Paano Pamahalaan ang Mga Awtomatikong Update ng Raspberry Pi

Maaari bang ayusin ang Arduino

Paano Suriin kung ang isang Halaga ay isang Numero sa JavaScript

Ang Pinakamataas na Laki ng Stack ng Tawag ay Lumampas sa Error sa JavaScript | Ipinaliwanag

Bakit Hindi Nagpapakita ang Docker Build ng Anumang Output Mula sa Mga Utos?

Pag-aalis ng Mga Duplicate sa Google Sheets