解读神秘的华为昇腾910
1-如果从数据从HBM拿到,通过BIU(总线IO单元)进入到DSA的角度,实际上,是要先经过MTE,所谓的存储转换单元,这也是达芬奇设计的一个特点,我个人理解,它其实是做了硬件层面的embedding,这个好处见仁见智,如果网络固定没问题,但是如果网络不固定,这个设计反而成了一个掣肘(估计后面的产品线会把它去掉,尤其在大模型时代)目前市面上跟训练推理相关,在售卖的,能查到资料的主要是两个系列,310,910,大版本叫这个,但是不同的ABC啥的,性能完全不同。这期内容就这么多,主要我搜到的资料也就这么多。
复制链接