Paano Magpapatupad ng Data Warehousing Gamit ang Amazon Redshift?

Paano Magpapatupad Ng Data Warehousing Gamit Ang Amazon Redshift



Ang mga tradisyunal na database ay maaaring makatulong sa mga user na magsagawa ng mga kumplikadong query o makuha ang ninanais na mga resulta ngunit may ilang mga kakulangan sa pagpipiliang ito. Ang pag-set up ng hardware at pag-install ng mga database upang magpatakbo ng mga query, mga problema sa storage para sa data, mabagal na pagganap, at manu-manong pagpapanatili ay ilan sa ilang mga isyu sa tradisyonal na mga database.

Ang artikulong ito ay nagbibigay ng mas malalim na pag-unawa sa mga user nito para sa pagpapatupad ng Data Warehouse sa AWS Redshift.

Ano ang AWS Redshift?

Binibigyang-daan ng AWS Redshift ang mga user nito na kunin at manipulahin ang data nang wala ang lahat ng configuration ng isang tradisyunal na database. Matalinong sinusukat nito ang kapasidad depende sa pangangailangan ng aplikasyon, nagbibigay ng mabilis at tumpak na mga tugon, at ganap na pinamamahalaan ng AWS. Ang AWS Redshift ay malawakang ginagamit para sa malawak nitong aplikasyon ng Big Data Analysing. Higit pa rito, sinusunod nito ang modelong pay-as-you-use at hindi nagkakaroon ng mga karagdagang singil kapag walang ginagawa ang bodega:









Matuto nang higit pa tungkol sa Redshift sa pamamagitan ng pagsangguni sa artikulong ito: 'Ano ang Mga Uri ng Data ng Amazon Redshift' :



Paano Magpapatupad ng Data Warehousing sa Amazon Redshift?

Ginagamit ng Amazon Redshift ang Standard Query Language (SQL) sa iba't ibang warehouse para sa pagsasagawa ng mga query. Nakakapagod ang pagkuha ng mga maximum na halaga habang sinusubaybayan ang gastos ng manu-manong pag-set up ng Data Warehouse. Samakatuwid, tumpak at matalinong pinapabilis ng AWS Redshift ang iyong gawain sa negosyo na nauugnay sa data at tinutulungan kang mapabilis ang iyong oras upang makakuha ng insight sa data sa mabilis, madali, maaasahan, at secure na paraan. Mayroong maraming mga benepisyo ng pagpapatupad ng Data Warehousing sa Amazon Redshift:





  • Data Encryption
  • Intelligent Optimization
  • Pinakamainam na Gastos
  • I-automate ang Mga Paulit-ulit na Gawain
  • Auto-scaling Capacity
  • Suporta sa Iba't ibang Mapagkukunan ng AWS

Nasa ibaba ang ilang hakbang kung saan maaari naming ipatupad ang Data Warehousing sa Amazon Redshift:

Hakbang 1: Gumawa ng Tungkulin ng IAM

Ang unang hakbang sa pagpapatupad ng Data Warehouse sa AWS Redshift nagsisimula sa paglikha ng isang tungkulin ng IAM. Para sa layuning ito, hanapin at piliin ang tungkulin ng IAM sa AWS Management Console :



Mag-click sa “Mga Tungkulin” opsyon mula sa sidebar ng tungkulin ng IAM:

Mag-click sa 'Gumawa ng tungkulin' susunod na pindutan:

Nasa Uri ng pinagkakatiwalaang entity seksyon, i-click ang “serbisyo ng AWS” habang ginagawa namin itong IAM role para sa Redshift:

Nasa Use case seksyon , pumili “Redshift” sa naka-highlight na field at magpatuloy upang piliin ang sumusunod na naka-highlight na opsyon. Mag-click sa “Susunod” button pagkatapos:

Nasa Patakaran sa Pahintulot seksyon , hanapin at piliin ang “AmazonS3ReadOnlyAccess” opsyon. At pagkatapos ay mag-click sa “Susunod” button pagkatapos:

Nasa Mga detalye ng tungkulin seksyon , ibigay ang pangalan para sa tungkulin:

Pinapanatili ang natitirang bahagi ng mga setting bilang default, i-click ang 'Gumawa ng tungkulin' button sa ibaba ng interface:

Ang papel ay naging matagumpay nilikha. Mag-click sa 'Tingnan ang tungkulin' pindutan:

Nasa Tingnan ang tungkulin seksyon, kopyahin ang RNA at i-save ito sa Notepad para magamit sa hinaharap:

Hakbang 2: Gumawa ng Redshift Cluster

Sa AWS Management Console, hanapin at pagkatapos ay piliin ang “Redshift” serbisyo:

Mag-scroll pababa sa “Redshift” pangunahing console at mag-click sa 'Gumawa ng cluster' pindutan:

Ito ay mag-navigate sa gumagamit sa 'Gumawa ng Cluster' interface. Dito sa interface na ito, magbigay ng pangalan para sa cluster at piliin ang “dc.2 malaki” para sa uri ng kumpol:

Nasa Mga pagsasaayos ng database mga seksyon, magbigay ng a username at password para sa kumpol:

Mag-scroll pababa sa Mga tungkulin ng IAM seksyon. Isasama namin ang tungkulin ng IAM dito na ginawa namin kanina sa tutorial na ito. Para sa layuning ito, mag-click sa “Iugnay ang tungkulin ng IAM” pindutan:

Sa seksyong ito, pinili namin ang papel na ginawa at na-click ang 'Iugnay ang mga tungkulin ng IAM' pindutan upang ilakip ang tungkulin:

Pagpapanatiling ang mga default, mag-click sa 'Gumawa ng cluster' button sa ibaba ng interface:

Magtatagal ito bago maging available ang cluster. Mag-click sa pangalan ng cluster mula sa RDS Dashboard pagkatapos lumabas ang status 'Aktibo':

Hakbang 3: Magdagdag ng Mga Pahintulot

I-access ang serbisyo ng IAM mula sa AWS Management Console hanggang mag-configure ng bagong patakaran sa root user account:

Galing sa IAM Dashboard, i-click ang 'Mga Gumagamit' opsyon mula sa kaliwang sidebar:

Mag-click sa Pangalan ng tungkulin na may access ng administrator sa account:

I-tap ang 'Magdagdag ng mga pahintulot' button na matatagpuan sa interface:

Mag-click sa 'Direktang Maglakip ng Mga Patakaran' opsyon sa ilalim ng Mga pagpipilian sa pahintulot seksyon:

Idagdag ang mga sumusunod na pahintulot sa iyong account:

  • AmazonRedshiftQueryEditor
  • AmazonRedshiftQueryEditorV2FullAccess
  • AmazonRedshiftReadOnlyAccess

Pagkatapos idagdag ang mga sumusunod na pahintulot, mag-click sa “Susunod” pindutan:

Nasa Buod ng mga pahintulot seksyon, i-click ang 'Magdagdag ng mga pahintulot' pindutan:

Dito matagumpay na na-configure ang mga pahintulot:

Hakbang 4: Editor ng Query

Sa Dashboard ng AWS RDS , i-click ang 'Editor ng query v2' opsyon mula sa sidebar:

Ipapakita nito ang sumusunod na interface. Sa interface na ito, piliin ang pangalan ng iyong cluster at ibigay ang mga sumusunod na detalye para sa koneksyon. Pagkatapos ibigay ang mga detalye, mag-click sa 'Gumawa ng koneksyon' pindutan:

Para sa mga layunin ng pagsubok, ibibigay namin ang sumusunod na query at pindutin ang 'Tumakbo' pindutan:

Ang query ay naisakatuparan matagumpay:

Iyon ay mula sa gabay na ito. Ngayon ang user ay maaaring magpatakbo ng iba't ibang mga query sa console na ito hal., Lumikha, Ipasok, Tanggalin, atbp.

Konklusyon

Upang lumikha ng Data Warehousing na may Redshift, i-configure ang isang tungkulin at pahintulot ng IAM sa cluster ng RDS at mag-click sa ' Editor ng query ” opsyon upang magsagawa ng mga query. Ang AWS Redshift ay isang cloud-based na database na sumusunod sa syntax ng SQL at nagsasagawa ng mga query sa malalaking dataset nang mahusay para sa mataas na pagganap. Ang artikulong ito ay nagbibigay ng mga tagubilin para sa Pagpapatupad ng Data Warehousing sa Amazon Redshift.