CUDNN是英偉達(dá)公司(NVIDIA)開發(fā)的一個(gè)深度學(xué)習(xí)加速庫,它基于CUDA技術(shù),可以加速深度學(xué)習(xí)算法的運(yùn)行,提高計(jì)算效率和速度。CUDNN包含了大量的高性能算法和優(yōu)化技術(shù),可以幫助深度學(xué)習(xí)開發(fā)者更加高效地訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)模型。CUDNN支持各種不同的深度學(xué)習(xí)框架,例如TensorFlow、Caffe、PyTorch等,可以在不同的平臺(tái)和設(shè)備上運(yùn)行,例如GPU、CPU等。CUDNN還提供了各種不同的API,例如卷積、池化、歸一化等,可以方便地集成到深度學(xué)習(xí)應(yīng)用程序中??偟膩碚f,CUDNN是一個(gè)非常強(qiáng)大和實(shí)用的深度學(xué)習(xí)加速庫,可以幫助深度學(xué)習(xí)開發(fā)者更快地訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)模型。
CUDNN軟件功能:
·支持Volta-GPU架構(gòu),包括新的Tesla V100 加速器
·協(xié)作組,一個(gè)用于管理通信線程組的新編程模型
·用于編程Tensor Core矩陣的新型API在Tesla V100上進(jìn)行乘法或加法的操作
·更快的程序庫用于線性代數(shù),圖像處理,F(xiàn)FT等
·在CuSolver和nvGroup中的新算法
·新的NVIDIA Visual Profiler支持Volta V100以及改進(jìn)同一內(nèi)存的分析功能
·提高編譯器性能
·在CUDA設(shè)備代碼中支持 C++14
·擴(kuò)大開發(fā)平臺(tái)和主機(jī)編譯器,包括Microsoft Visual Studio 2017, Clang 3.9, PGI17.1和GCC6.x
CUDA 支持新的NVIDIA Volta 架構(gòu)
CUDA 的核心是支持新型Volta架構(gòu),特別是GTC 2017推出的新Tesla V100 GPU加速器。
Tesla V100新的SM(流式多處理器)為深度學(xué)習(xí)和HPC提供了極高的浮點(diǎn)和整數(shù)性能。新的Volta SM比上一代Pascal設(shè)計(jì)能效高50%,在相同的功率范圍內(nèi)可大幅度提升FP32和FP64性能。在深度學(xué)習(xí)訓(xùn)練上,有12倍的峰值TFLOPs提升,在深度學(xué)習(xí)推理上,有6倍提升。通過獨(dú)立的并行整數(shù)和浮點(diǎn)數(shù)據(jù)路徑,Volta SM在計(jì)算和尋址計(jì)算的組合下,對(duì)工作負(fù)載的效率也更高。Volta的新獨(dú)立線程調(diào)度能力使得并行線程之間的細(xì)粒度同步協(xié)同成為可能。最終,新型的L1 Data Cache 與Shared Memory子系統(tǒng)的結(jié)合極大地提升了性能,同時(shí)也簡化了編程。
CUDNN軟件的特點(diǎn)如下:
1. 高效性:CUDNN使用了多種高效的算法和優(yōu)化技術(shù),可以提高深度學(xué)習(xí)算法的運(yùn)行速度和計(jì)算效率。
2. 靈活性:CUDNN支持各種不同的深度學(xué)習(xí)框架和平臺(tái),可以在不同的設(shè)備上運(yùn)行,并且可以方便地集成到應(yīng)用程序中。
3. 易用性:CUDNN提供了各種不同的API,例如卷積、池化、歸一化等,可以方便地使用和調(diào)用。
4. 可擴(kuò)展性:CUDNN支持多GPU并行計(jì)算,可以提高計(jì)算效率和速度。
5. 準(zhǔn)確性:CUDNN使用了精確的數(shù)值計(jì)算方法,可以保證深度學(xué)習(xí)算法的準(zhǔn)確性和穩(wěn)定性。
總的來說,CUDNN是一個(gè)非常強(qiáng)大和實(shí)用的深度學(xué)習(xí)加速庫,可以幫助深度學(xué)習(xí)開發(fā)者更快地訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)模型。
CUDNN安裝教程:
1、首先需要確認(rèn)你的電腦顯卡已經(jīng)安裝好了驅(qū)動(dòng)并且是支持Cuda
的,從本站下載cudnn,我選擇的版本是cuda_10.1.243_426.00_win10.exe
2\安裝的時(shí)候建議選擇自定義而不是“精簡”(從下面的英文解釋可以看出,其實(shí)這里的精簡寫成完整應(yīng)該更貼切,他會(huì)安裝所有組件并覆蓋現(xiàn)有驅(qū)動(dòng),然而我并不想安裝全家桶,何況我的官方顯卡驅(qū)動(dòng)比他的新)。
3\如下圖所示,我們只需選擇CUDA項(xiàng)(默認(rèn)是全選的),這一步之后,會(huì)詢問這些組件的安裝路徑,可以直接使用C盤的默認(rèn)位置,當(dāng)然我們可以可以自己定義(請(qǐng)記住這些安裝路徑,后面配置環(huán)境變量需要用到)。
環(huán)境變量和測(cè)試
檢查系統(tǒng)變量
添加環(huán)境變量后如下圖所示:
可以通過如下指令測(cè)試安裝和配置是否成功:
nvcc --version
nvcc -V
輸出結(jié)果如下所示:
顯示cuda版本號(hào)10.1 V10.1.243
,說明安裝成功!
Cudnn 安裝
解壓文件夾,顯示內(nèi)容如下:
將解壓文件夾cuda
目錄下的文件分別復(fù)制到cuda
安裝目錄下的對(duì)應(yīng)文件夾下面,如下所示:
恭喜你,安裝完成?。?!