文件名称:SIMD_Benchmarking:基本矩阵和向量运算的性能比较。 参考与 x86 SIMD 内在函数(SSE、AVX(128256 位)和 AVX2FMA3 指令集)
文件大小:10KB
文件格式:ZIP
更新时间:2024-07-29 08:43:27
C++
SIMD 基准测试 测试基本矩阵和向量运算与其 SIMD 对应物的相对性能。 每个操作的时间平均超过 10000 次运行。 使用随机单精度浮点数的 4x4 矩阵或 4D 向量。 对 AVX 128 位 (XMM) 和 256 位 (YMM) 寄存器执行的单独计算。 AVX2/FMA3(128 位)指令集(融合乘加)需要 Intel Haswell CPU 。 所有操作都经过了相当大的优化。 SIMD 矩阵乘法使用线性组合方法。 在带有 Intel i5-4278u 2.6 GHz 双核 Haswell CPU 的 2014 rMBP 上进行测试。 操作系统:在 VMWare Fusion 7 上运行的 Windows 8.1。 使用 MSVC++ 2012 编译: x64 mode 、 /arch:AVX 、 /fp:Fast 通过__rdtsc()在 CPU 时钟周期中计时。 (也可以
【文件预览】:
SIMD_Benchmarking-master
----Timer()
--------Timer.cpp(1KB)
--------GlobalTimer.h(650B)
--------Timer.h(684B)
----Vect4D.h(568B)
----SIMD Benchmarks.vcxproj(13KB)
----Matrix.h(5KB)
----SIMD Benchmarks.vcxproj.filters(1KB)
----Vect4D.cpp(1KB)
----main.cpp(3KB)
----README.md(1KB)
----Matrix.cpp(2KB)
----SIMD Benchmarks.sln(2KB)
----.gitignore(763B)