Ano ang Pinakamahusay na Card ng Graphics para sa Malalim na Pag-aaral?

Kung ang isang CPU ay utak ng isang PC, kung gayon ang isang GPU ay ang kaluluwa. Habang ang karamihan sa mga PC ay maaaring gumana nang walang isang mahusay na GPU, ang malalim na pag-aaral ay hindi posible nang walang isa. Ito ay sapagkat ang malalim na pag-aaral ay nangangailangan ng mga kumplikadong operasyon tulad ng pagmamanipula ng matrix, natatanging mga kinakailangan sa computational, at malaking kapangyarihan sa computing.

Mahalaga ang karanasan sa pagbuo ng mga kasanayang kinakailangan upang mailapat ang malalim na pag-aaral sa mga bagong isyu. Ang isang mabilis na GPU ay nangangahulugang isang mabilis na makakuha sa praktikal na karanasan sa pamamagitan ng agarang feedback. Naglalaman ang mga GPU ng maraming mga core upang makitungo sa mga parallel computations. Isinasama din nila ang malawak na bandwidth ng memorya upang pamahalaan ang impormasyong ito nang madali.

Ang aming nangungunang inirekumendang pick para sa Pinakamahusay na Card ng Graphics para sa Deep Learning ay ang Nvidia Geforce RTX 2080 Founders Edition. Bilhin ito ngayon sa halagang $ 1,940 USD sa Amazon

Sa pag-iisip na ito, hinahangad naming sagutin ang tanong, Ano ang pinakamahusay na graphics card para sa AI, pag-aaral ng makina at malalim na pag-aaral? sa pamamagitan ng pagsusuri ng maraming mga graphic card na kasalukuyang magagamit noong 2021. Sinuri ng mga Card:

AMD RX Vega 64

NVIDIA Tesla V100

Nvidia Quadro RTX 8000

GeForce RTX 2080 Ti

NVIDIA Titan RTX

Nasa ibaba ang mga resulta:

AMD RX Vega 64

Radeon RX Vega 64

Mga Tampok

Petsa ng Paglabas: August 14, 2017
Vega Architecture
PCI Express Interface
Bilis ng Orasan: 1247 MHz
Mga Processor ng Stream: 4096
VRAM: 8 GB
Memory Bandwidth: 484 GB / s

Pagsusuri

Kung hindi mo gusto ang mga NVIDIA GPU, o hindi ka pinapayagan ng iyong badyet na gumastos ng mas mataas na $ 500 sa isang graphics card, kung gayon ang AMD ay may matalinong kahalili. Ang pag-upo ng isang disenteng halaga ng RAM, isang mabilis na bandwidth ng memorya, at higit sa sapat na mga processor ng stream, ang AMD's RS Vega 64 ay napakahirap balewalain.

Ang arkitektura ng Vega ay isang pag-upgrade mula sa nakaraang mga RX card. Sa mga tuntunin ng pagganap, ang modelong ito ay malapit sa GeForce RTX 1080 Ti, dahil ang pareho sa mga modelong ito ay may katulad na VRAM. Bukod dito, sinusuportahan ng Vega ang katutubong kalahating katumpakan (FP16). Gumagana ang ROCm at TensorFlow, ngunit ang software ay hindi kasing-edad tulad ng sa mga NVIDIA graphics card.

Sa kabuuan, ang Vega 64 ay isang disenteng GPU para sa malalim na pag-aaral at AI. Ang modelong ito ay nagkakahalaga ng mas mababa sa $ 500 USD at natapos ang trabaho para sa mga nagsisimula. Gayunpaman, para sa mga propesyonal na aplikasyon, inirerekumenda namin ang pagpili para sa isang NVIDIA card.

Mga Detalye ng AMD RX Vega 64: Amazon

NVIDIA Tesla V100

Tesla V100

Mga Tampok:

Petsa ng Paglabas: Disyembre 7, 2017
Arkitektura ng NVIDIA Volta
Interface ng PCI-E
112 TFLOPS Pagganap ng Tensor
640 Mga Kulay ng Tensor
5120 Mga Kulay ng NVIDIA CUDA®
VRAM: 16 GB
Memory Bandwidth: 900 GB / s
Mag-compute ng mga API: CUDA, DirectCompute, OpenCL ™, OpenACC®

Pagsusuri:

Ang NVIDIA Tesla V100 ay isang behemoth at isa sa mga pinakamahusay na graphics card para sa AI, pag-aaral ng makina, at malalim na pag-aaral. Ang kard na ito ay ganap na na-optimize at naka-pack na may lahat ng mga kalakal na maaaring kailanganin para sa hangaring ito.

Ang Tesla V100 ay nasa 16 GB at 32 GB na mga pagsasaayos ng memorya. Sa maraming VRAM, pagpapabilis ng AI, mataas na bandwidth ng memorya, at dalubhasang mga tenor core para sa malalim na pag-aaral, masisiguro mo na ang iyong bawat modelo ng pagsasanay ay tatakbo nang maayos - at sa mas kaunting oras. Partikular, ang Tesla V100 ay maaaring maghatid ng 125TFLOPS ng malalim na pagganap ng pag-aaral para sa parehong pagsasanay at hinuha [3], na ginawang posible ng arkitekturang Volta ng NVIDIA.

Mga Detalye ng NVIDIA Tesla V100: Amazon , ( 1 )

Nvidia Quadro RTX 8000

Nvidia Quadro Rtx 8000

Mga Tampok:

Petsa ng Paglabas: Agosto 2018
Turing Arkitektura
576 Mga Kulay ng Tensor
Mga Kulay ng CUDA: 4,608
VRAM: 48 GB
Memory Bandwidth: 672 GB / s
16.3 TFLOPS
System interface: PCI-Express

Pagsusuri:

Partikular na binuo para sa malalim na pag-aaral ng matrix arithmetic at computations, ang Quadro RTX 8000 ay isang nangungunang graphics card. Dahil ang kard na ito ay may kasamang malaking kapasidad ng VRAM (48 GB), inirerekomenda ang modelong ito para sa pagsasaliksik ng labis na malalaking mga modelo ng computational. Kapag ginamit nang pares sa NVLink, ang kapasidad ay maaaring tumaas hanggang sa 96 GB ng VRAM. Alin ang marami!

Ang isang kumbinasyon ng 72 RT at 576 Tensor core para sa mga pinahusay na daloy ng trabaho ay nagreresulta sa higit sa 130 TFLOPS ng pagganap. Kung ihahambing sa pinakamahal na graphics card sa aming listahan - ang Tesla V100 - ang modelong ito ay potensyal na nag-aalok ng 50 porsyento pang memorya at namamahala pa rin ng mas mababa sa gastos. Kahit na sa naka-install na memorya, ang modelong ito ay may natatanging pagganap habang nagtatrabaho kasama ang mas malaking sukat ng batch sa isang solong GPU.

Muli, tulad ng Tesla V100, ang modelong ito ay limitado lamang ng iyong presyo sa bubong. Sinabi na, kung nais mong mamuhunan sa hinaharap at sa mataas na kalidad na computing, kumuha ng isang RTX 8000. Sino ang nakakaalam, maaari mong pangunahan ang pagsasaliksik sa AI. Ang Tesla V100 ay batay sa arkitektura ng Turing kung saan ang V100 ay batay sa arkitektura ng Volta, kaya ang Nvidia Quadro RTX 8000 ay maaaring maituring na medyo mas moderno at medyo mas malakas kaysa sa V100.

Mga Detalye ng Nvidia Quadro RTX 8000: Amazon

GeForce RTX 2080 Ti

Geforce RTX 2080 Founders Edition

Mga Tampok:

Petsa ng Paglabas: Setyembre 20, 2018
Turing GPU arkitektura at ang RTX platform
Bilis ng Orasan: 1350 MHz
Mga Kulay ng CUDA: 4352
11 GB ng susunod na gen, sobrang bilis ng memorya ng GDDR6
Memory Bandwidth: 616 GB / s
Lakas: 260W

Pagsusuri:

Ang GeForce RTX 2080 Ti ay isang perpektong pagpipilian sa badyet para sa mga maliliit na workload ng pagmomodelo, sa halip na malakihang pag-unlad na pagsasanay. Ito ay dahil mayroon itong isang mas maliit na memorya ng GPU bawat card (11 GB lamang). Ang mga limitasyon ng modelong ito ay naging mas halata kapag nagsasanay ng ilang mga modernong modelo ng NLP. Gayunpaman, hindi ito nangangahulugan na ang kard na ito ay hindi maaaring makipagkumpetensya. Ang disenyo ng blower sa RTX 2080 ay nagbibigay-daan para sa mas malawak na mga pagsasaayos ng system - hanggang sa apat na GPU sa loob ng isang solong workstation. Dagdag pa, sinasanay ng modelong ito ang mga neural network na 80 porsyento ang bilis ng Tesla V100. Ayon sa mga malalim na benchmark ng pagganap ng LambdaLabs, kung ihinahambing sa Tesla V100, ang RTX 2080 ay 73% ang bilis ng FP2 at 55% ang bilis ng FP16.

Samantala, ang modelong ito ay nagkakahalaga ng halos 7 beses na mas mababa kaysa sa isang Tesla V100. Mula sa parehong pananaw sa presyo at pagganap, ang GeForce RTX 2080 Ti ay isang mahusay na GPU para sa malalim na pag-aaral at pag-unlad ng AI.

Mga Detalye ng GeForce RTX 2080 Ti: Amazon

NVIDIA Titan RTX

NVIDIA Titan RTX Graphics

Mga Tampok:

Petsa ng Paglabas: Disyembre 18, 2018
Pinapagana ng arkitektura ng NVIDIA Turing ™ na dinisenyo para sa AI
576 Tensor Cores para sa pagpapabilis ng AI
130 teraFLOPS (TFLOPS) para sa malalim na pagsasanay sa pag-aaral
Mga Kulay ng CUDA: 4608
VRAM: 24 GB
Memory Bandwidth: 672 GB / s
Inirekumenda na supply ng kuryente na 650 watts

Pagsusuri:

Ang NVIDIA Titan RTX ay isa pang mid-range GPU na ginamit para sa kumplikadong mga operasyon sa malalim na pag-aaral. Ang 24 GB ng VRAM ng modelong ito ay sapat na upang gumana sa karamihan ng mga laki ng batch. Kung nais mong sanayin ang mas malalaking mga modelo, gayunpaman, ipares ang card na ito sa tulay ng NVLink upang mabisa ang 48 GB ng VRAM. Ang halagang ito ay magiging sapat kahit para sa malalaking mga modelo ng transpormer na NLP. Bukod dito, pinapayagan ng Titan RTX ang buong rate ng pagsasanay na halo-halong katumpakan para sa mga modelo (ibig sabihin, FP 16 kasama ang akumulasyon ng FP32). Bilang isang resulta, gumaganap ang modelong ito ng humigit-kumulang 15 hanggang 20 porsyento na mas mabilis sa mga operasyon kung saan ginagamit ang Tensor Cores.

Ang isang limitasyon ng NVIDIA Titan RTX ay ang disenyo ng kambal na tagahanga. Pinipigilan nito ang mas kumplikadong mga pagsasaayos ng system dahil hindi ito mai-pack sa isang workstation nang walang malaking pagbabago sa mekanismo ng paglamig, na hindi inirerekomenda.

Sa pangkalahatan, ang Titan ay isang mahusay, all-purpose GPU para sa halos anumang malalim na gawain sa pag-aaral. Kung ihahambing sa iba pang mga pangkalahatang layunin card ng graphics, tiyak na ito ay mahal. Iyon ang dahilan kung bakit hindi inirerekomenda ang modelong ito para sa mga manlalaro. Gayunpaman, ang labis na VRAM at pagpapalakas ng pagganap ay malamang na pahalagahan ng mga mananaliksik na gumagamit ng mga kumplikadong mga modelo ng malalim na pag-aaral. Ang presyo ng Titan RTX ay makabuluhang mas mababa kaysa sa V100 na ipinakita sa itaas at magiging isang mahusay na pagpipilian kung hindi pinapayagan ng iyong badyet para sa pagpepresyo ng V100 na gumawa ng malalim na pag-aaral o ang iyong workload ay hindi nangangailangan ng higit sa Titan RTX ( tingnan ang mga kagiliw-giliw na benchmark )

Mga Detalye ng NVIDIA Titan RTX: Amazon

Pagpili ng pinakamahusay na graphics card para sa AI, pag-aaral ng makina, at malalim na pag-aaral

Ang AI, pag-aaral ng makina, at ang mga malalim na gawain sa pag-aaral ay nagpoproseso ng mga tambak ng data. Ang mga gawaing ito ay maaaring maging napaka hinihingi sa iyong hardware. Nasa ibaba ang mga tampok na dapat tandaan bago bumili ng isang GPU.

Kulay

Bilang isang simpleng panuntunan sa hinlalaki, mas maraming bilang ng mga core, mas mataas ang pagganap ng iyong system. Ang bilang ng mga core ay dapat ding isaalang-alang, lalo na kung nakikipag-usap ka sa isang malaking halaga ng data. Pinangalanan ng NVIDIA ang mga core nito na CUDA, habang ang AMD ay tumatawag sa kanilang mga cores stream processor. Pumunta para sa pinakamataas na bilang ng mga pagpoproseso ng mga core na papayagan ng iyong badyet.

Kapangyarihang magproseso

Ang lakas ng pagproseso ng isang GPU ay nakasalalay sa bilang ng mga core sa loob ng system na pinarami ng bilis ng orasan kung saan pinapatakbo mo ang mga core. Kung mas mataas ang bilis at mas mataas ang bilang ng mga core, mas mataas ang magiging proseso ng pagproseso kung saan maaaring makalkula ng iyong data ang iyong GPU. Natutukoy din nito kung gaano kabilis gagawa ang iyong system ng isang gawain.

VRAM

Ang Video RAM, o VRAM, ay isang pagsukat ng dami ng data na maaaring hawakan ng iyong system nang sabay-sabay. Mahalaga ang Mas Mataas na VRAM kung nagtatrabaho ka sa iba't ibang mga modelo ng Computer Vision o gumaganap ng anumang mga kumpetisyon ng CV Kaggle. Ang VRAM ay hindi gaano kahalaga para sa NLP, o para sa pagtatrabaho sa iba pang kategoryang data.

Memory Bandwidth

Ang Memory Bandwidth ay ang rate kung saan nababasa o naimbak ang data sa memorya. Sa simpleng mga termino, ito ang bilis ng VRAM. Sinusukat sa GB / s, higit pang Memory Bandwidth ay nangangahulugan na ang card ay maaaring gumuhit ng mas maraming data sa mas kaunting oras, na isinasalin sa mas mabilis na operasyon.

Paglamig

Ang temperatura ng GPU ay maaaring maging isang makabuluhang bottleneck pagdating sa pagganap. Ang mga modernong GPU ay nagdaragdag ng kanilang bilis sa isang maximum habang nagpapatakbo ng isang algorithm. Ngunit sa lalong madaling maabot ang isang tiyak na temperatura threshold, binabawasan ng GPU ang bilis ng pagproseso upang maprotektahan laban sa sobrang pag-init.

Ang disenyo ng bentilador ng bentilador para sa mga air cooler ay nagtutulak ng hangin sa labas ng system habang ang mga di-blower na tagahanga ay sumisipsip ng hangin. Sa arkitektura kung saan maraming mga GPU ang inilalagay sa tabi ng bawat isa, ang mga tagahanga na hindi blower ay magpapainit pa. Kung gumagamit ka ng paglamig sa hangin sa isang pag-set up na may 3 hanggang 4 na GPU, iwasan ang mga hindi tagahanga ng blower.

Ang paglamig ng tubig ay isa pang pagpipilian. Kahit na mahal, ang pamamaraang ito ay mas tahimik at tinitiyak na kahit na ang pinakaka-beef na pag-setup ng GPU ay mananatiling cool sa buong operasyon.

Konklusyon

Para sa karamihan ng mga gumagamit na sumusubok sa malalim na pag-aaral, ang RTX 2080 Ti o ang Titan RTX ay magbibigay ng pinakadakilang putok para sa iyong buck. Ang tanging sagabal ng RTX 2080 Ti ay isang limitadong 11 GB na laki ng VRAM. Pinapayagan ng pagsasanay na may mas malaking sukat ng pangkat na mas mabilis ang pagsasanay ng mga modelo at mas tumpak, na nakakatipid ng maraming oras ng gumagamit. Posible lamang ito kapag mayroon kang Quadro GPUs o isang TITAN RTX. Ang paggamit ng kalahating-katumpakan (FP16) ay nagbibigay-daan sa mga modelo na magkasya sa mga GPU na may hindi sapat na laki ng VRAM [2]. Para sa higit pang mga advanced na gumagamit, gayunpaman, ang Tesla V100 ay kung saan dapat kang mamuhunan. Iyon ang aming nangungunang pumili para sa pinakamahusay na graphics card para sa AI, pag-aaral ng makina at malalim na pag-aaral. Iyon lang ang para sa artikulong ito. Inaasahan namin na nagustuhan mo ito. Hanggang sa muli!

Ano ang Pinakamahusay na Card ng Graphics para sa Malalim na Pag-aaral?

Mga Tampok

Pagsusuri

Mga Tampok:

Pagsusuri:

Mga Tampok:

Pagsusuri:

Mga Tampok:

Pagsusuri:

Mga Tampok:

Pagsusuri:

Pagpili ng pinakamahusay na graphics card para sa AI, pag-aaral ng makina, at malalim na pag-aaral

Kulay

Kapangyarihang magproseso

VRAM

Memory Bandwidth

Paglamig

Konklusyon

Mga Sanggunian

Kategorya

Patok Na Mga Post