swizzle

本仓库为 Swizzle 实验仓库，从 Tensor Core 的 MMA 相关指令出发探索了如何利用 Swizzle 高效地进行 Tensor Core 矩阵乘法。

成果展示

对 FP16 的 m16n16k16 Tensor Core 的使用优化如下：

算子依次为：

实验代码位于 src/ 目录下，各文件作用如下：

拉取本仓库后可直接运行如下命令运行：

mkdir build && cd build
cmake ..
make 
./main

使用本仓库的建议：

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
assets		assets
doc		doc
src		src
.clang-format		.clang-format
.clangd		.clangd
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
metrics.txt		metrics.txt