GPU
對圖像進行處理的相關(guān)計算。
1999年,美國英偉達公司推出世界上第一款圖像處理器芯片。2001年,科學(xué)計算開發(fā)人員從矩陣乘法運算著手GPU通用計算。2008年,英偉達推出支持CUDA的Tesla架構(gòu)顯卡之后,GPU迅速轉(zhuǎn)向?qū)嵱茫谟嬎懔W(xué)、地質(zhì)科學(xué)、生命科學(xué)、雷達遙感、計算金融等領(lǐng)域得到應(yīng)用。
?21世紀(jì)以來,GPU已經(jīng)成為高性能計算的重要角色。2017年11月最新的TOP500數(shù)據(jù)顯示,世界排名前500的超級計算機中,有87臺采用了GPU協(xié)處理器。Volta架構(gòu)動搖了2018年的TOP500版圖,它的性能飛越能夠重新定義超級計算機:過去,千萬億次計算意味著一個機房、一個集群,現(xiàn)在僅需要一個8卡GPU節(jié)點就能實現(xiàn)。
?GPU微架構(gòu)以高度并發(fā)為基礎(chǔ)特征,其并行編程模型主要是CUDA和OpenCL。前者是一個配備完整工具包、針對單一供應(yīng)商(英偉達)的成熟開發(fā)平臺,具有統(tǒng)一的開發(fā)套件(CUDA Toolkit、NVIDIA GPU Computing SDK、NSight等)、非常豐富的庫(cuBLAS、cuFFT、cuSPARSE、cuRAND、NPP、Thrust、NCCL等)以及PTX匯編代碼生成、離線編譯等成熟的編譯器特性;后者是一個有著開放的標(biāo)準(zhǔn),具有跨平臺性和通用性,支持包括Nvidia、AMD、Intel、Qualcomm、ARM在內(nèi)的多類處理器,能夠更好地支持異構(gòu)計算。
?GPU的出現(xiàn)和發(fā)展,與傳統(tǒng)CPU形成了強烈的對比和有效互補。CPU擅長處理具有復(fù)雜控制邏輯的任務(wù),如操作系統(tǒng)、通用應(yīng)用程序;而GPU擅長處理大量同類型數(shù)據(jù)上的密集數(shù)值計算。GPU的定位仍舊是CPU的加速器/協(xié)處理器,但是考慮到阿姆達爾定律,整體加速受限于不可并行的部分,應(yīng)當(dāng)盡量減少程序中的串行處理。