GPU
對圖像進(jìn)行處理的相關(guān)計(jì)算。
1999年,美國英偉達(dá)公司推出世界上第一款圖像處理器芯片。2001年,科學(xué)計(jì)算開發(fā)人員從矩陣乘法運(yùn)算著手GPU通用計(jì)算。2008年,英偉達(dá)推出支持CUDA的Tesla架構(gòu)顯卡之后,GPU迅速轉(zhuǎn)向?qū)嵱?,在?jì)算力學(xué)、地質(zhì)科學(xué)、生命科學(xué)、雷達(dá)遙感、計(jì)算金融等領(lǐng)域得到應(yīng)用。
?21世紀(jì)以來,GPU已經(jīng)成為高性能計(jì)算的重要角色。2017年11月最新的TOP500數(shù)據(jù)顯示,世界排名前500的超級計(jì)算機(jī)中,有87臺(tái)采用了GPU協(xié)處理器。Volta架構(gòu)動(dòng)搖了2018年的TOP500版圖,它的性能飛越能夠重新定義超級計(jì)算機(jī):過去,千萬億次計(jì)算意味著一個(gè)機(jī)房、一個(gè)集群,現(xiàn)在僅需要一個(gè)8卡GPU節(jié)點(diǎn)就能實(shí)現(xiàn)。
?GPU微架構(gòu)以高度并發(fā)為基礎(chǔ)特征,其并行編程模型主要是CUDA和OpenCL。前者是一個(gè)配備完整工具包、針對單一供應(yīng)商(英偉達(dá))的成熟開發(fā)平臺(tái),具有統(tǒng)一的開發(fā)套件(CUDA Toolkit、NVIDIA GPU Computing SDK、NSight等)、非常豐富的庫(cuBLAS、cuFFT、cuSPARSE、cuRAND、NPP、Thrust、NCCL等)以及PTX匯編代碼生成、離線編譯等成熟的編譯器特性;后者是一個(gè)有著開放的標(biāo)準(zhǔn),具有跨平臺(tái)性和通用性,支持包括Nvidia、AMD、Intel、Qualcomm、ARM在內(nèi)的多類處理器,能夠更好地支持異構(gòu)計(jì)算。
?GPU的出現(xiàn)和發(fā)展,與傳統(tǒng)CPU形成了強(qiáng)烈的對比和有效互補(bǔ)。CPU擅長處理具有復(fù)雜控制邏輯的任務(wù),如操作系統(tǒng)、通用應(yīng)用程序;而GPU擅長處理大量同類型數(shù)據(jù)上的密集數(shù)值計(jì)算。GPU的定位仍舊是CPU的加速器/協(xié)處理器,但是考慮到阿姆達(dá)爾定律,整體加速受限于不可并行的部分,應(yīng)當(dāng)盡量減少程序中的串行處理。