文件名称:GemmKernels.jl:Julia中灵活高效的GEMM内核
文件大小:179KB
文件格式:ZIP
更新时间:2024-06-04 17:24:25
Julia
宝石核 Julia中灵活高效的GEMM内核 茱莉亚(Julia) CI 1.6晚 每夜 该软件包包含一个框架,用于实例化灵活的高性能GEMM(通用矩阵乘法)内核。 它将GEMM内核分解为正交分量: 参数确定GEMM内核的切片大小和启动配置。 切片大小以逻辑坐标指定,即具有用户指定的含义。 布局将图块的逻辑坐标转换为内存中的物理偏移量。 转换用于将任意的Julia函子应用于GEMM的输入或输出。 它们在每次加载之后和每个商店之前应用。 运算符负责自己执行矩阵乘法。 它们从共享内存中加载图块,执行矩阵乘法,然后将结果图块存储回共享内存中。 结语将所得矩阵的图块复制到全局存储器,并且可以用于执行任意后处理,例如将偏差向量添加到所得矩阵。 这些组件中的每一个对应于具有预定接口的一组功能。 用户可以通过Julia的多个调度功能来自定义这些功能。 该软件包包括2个面向用户的界
【文件预览】:
GemmKernels.jl-master
----Project.toml(568B)
----CITATION.bib(251B)
----.gitignore(1B)
----media()
--------performance-wmma-gemm.png(150KB)
----src()
--------blas.jl(3KB)
--------kernel.jl(19KB)
--------tiling.jl(9KB)
--------GemmKernels.jl(222B)
--------layout.jl(10KB)
--------epilogue.jl(3KB)
--------launch.jl(1KB)
--------operator.jl(10KB)
--------config.jl(10KB)
--------transform.jl(431B)
----LICENSE(2KB)
----.github()
--------workflows()
----README.md(4KB)
----.buildkite()
--------pipeline.yml(1KB)
----benchmarks()
--------.gitignore(12B)
--------diagonal()
--------complex-dual()
--------README.md(3KB)
--------operator-fusion()
--------wmma()
----test()
--------Project.toml(311B)
--------blas.jl(2KB)
--------tiling.jl(3KB)
--------matmul.jl(13KB)
--------runtests.jl(459B)