文件名称:Intel-Xeon-Phi-Bachelor-Thesis-
文件大小:4.73MB
文件格式:ZIP
更新时间:2024-06-15 07:53:53
Assembly
高效的算法在Intel XEON PHI上的实现 学士论文 多米尼克· Dominik Simek) FIT VUT 2015 抽象的 本文致力于在英特尔至强融核协处理器上实现高性能算法。 Xeon phi是Intel在2012年作为一种新的MIC(许多集成核心)架构引入的。本文的理论部分着重于协处理器的架构(对于单精度数据,其峰值性能为2 tFLOPS),以及算法实现和优化的过程。 然后将理论知识应用于实际示例,并演示实现和算法优化以及与协处理器一起工作。 在论文的实践部分中,对简单的基准进行了解释和实现,例如向量矩阵乘法和矩阵乘法。 在第一个基准测试中,理论协处理器性能达到了6.5%,而在第二个基准测试中则更高。 在下一章中,将讨论一个更复杂的基准,即粒子系统(N-Body)的仿真,该系统达到了协处理器性能(725 gFLOPS)的35%以上。 下一节专门讨论一些有趣的问题,例如优