Nvidia发布全新计算卡Tesla P40/P4

在北京召开的GTC 2016技术大会上，NVIDIA CEO黄仁勋亲自发布了新一代高性能计算卡Tesla P40、Tesla P4，专为人工智能、深度学习、神经网络推演而生！

这两款产品将取代上代麦克斯韦架构的Tesla M40/M4，当然用了最新的帕斯卡架构（你们看命名就知道了… P代表Pascal），16nm妥妥的。

Nvidia发布全新计算卡Tesla P40/P4

Tesla P40基于高端大核心GP100，并且开启全部 3840个流处理器(此前的Titan X只有3584个)，核心频率1303-1531MHz，FP32单精度浮点计算能力12 TFlops，INT8(八位数据专用推理指令) 处理性能高达 47 TOPS，响应速度比CPU快45倍。

该卡搭配384-bit 24GB GDDR5显存，等效显存频率为7.2Gbps，整卡功耗250W，采用被动式散热。（没错！真的是被动）值得一提的是，同是GP100大核心的Tesla P100也只开启了3584个流处理器，（比P40要少）。

Nvidia发布全新计算卡Tesla P40/P4

Tesla P4的核心则是GTX 1080/1070同款的GP104，全部2560个流处理器，核心频率只有810-1063MHz，单精度性能5.5TFlops，INT8 22TOPS，搭配256-bit 6Gbps 8GB GDDR5显存，功耗50-75W，半高被动散热。并且长度只有一根铅笔那么长！

相比于前辈，P4/P40的计算性能分别提升了70％、1.5倍，INT8特性也是首次加入，但功耗维持不变。

Nvidia发布全新计算卡Tesla P40/P4