文件名称:nvbench:ThrustCUB基准测试库
文件大小:142KB
文件格式:ZIP
更新时间:2024-03-24 23:13:07
Cuda
概述 该项目正在进行中。 一切都会发生变化。 NVBench是一个C ++ 17库,旨在简化CUDA内核基准测试。 它允许同时在多个轴上扫描参数,包括模板参数。 报告了各种计时,包括“冷”执行时间(每个计时区域单次运行)和“批量”执行时间(在单个计时区域内启动多个内核)。 沙箱项目示例 请参阅以获取一个简单的CMake项目,该项目使用NVBench构建示例基准。 范围和相关工具 NVBench将根据基准评测单个主机端关键区域的CPU和CUDA GPU执行时间。 它旨在用于单个内核的回归测试和参数调整。 为了深入分析多个应用程序的端到端性能,NVIDIA Nsight工具更合适。 NVBench专注于评估CUDA内核的性能,并且未针对CPU微基准进行优化。 将来可能会有所改变,但现在考虑将Google Benchmark用于高分辨率CPU基准测试。 最低基准 只需几行CUDA C ++就
【文件预览】:
nvbench-main
----cmake()
--------modules()
----nvbench()
--------markdown_printer.cuh(2KB)
--------runner.cuh(3KB)
--------csv_printer.cuh(985B)
--------int64_axis.cu(2KB)
--------state.cu(6KB)
--------printer_multiplex.cu(2KB)
--------flags.cuh(2KB)
--------launch.cuh(1KB)
--------benchmark_manager.cu(2KB)
--------blocking_kernel.cu(1KB)
--------benchmark_base.cuh(7KB)
--------type_axis.cuh(3KB)
--------runner.cu(2KB)
--------type_axis.cu(2KB)
--------internal()
--------float64_axis.cuh(2KB)
--------cuda_stream.cuh(1KB)
--------main.cuh(4KB)
--------type_strings.cu(1KB)
--------printer_base.cu(926B)
--------device_manager.cu(1KB)
--------axis_base.cuh(3KB)
--------summary.cuh(3KB)
--------device_info.cu(1KB)
--------csv_printer.cu(6KB)
--------cuda_timer.cuh(2KB)
--------float64_axis.cu(1000B)
--------exec_tag.cuh(4KB)
--------callable.cuh(3KB)
--------device_manager.cuh(1KB)
--------string_axis.cu(797B)
--------range.cuh(1KB)
--------markdown_printer.cu(15KB)
--------named_values.cu(5KB)
--------option_parser.cu(22KB)
--------string_axis.cuh(2KB)
--------int64_axis.cuh(3KB)
--------type_strings.cuh(3KB)
--------types.cuh(1KB)
--------named_values.cuh(2KB)
--------benchmark_base.cu(2KB)
--------benchmark_manager.cuh(2KB)
--------printer_multiplex.cuh(2KB)
--------state.cuh(8KB)
--------main.cu(829B)
--------axes_metadata.cuh(4KB)
--------CMakeLists.txt(1KB)
--------cuda_call.cu(2KB)
--------detail()
--------cuda_call.cuh(3KB)
--------cpu_timer.cuh(2KB)
--------axes_metadata.cu(8KB)
--------option_parser.cuh(4KB)
--------type_list.cuh(5KB)
--------blocking_kernel.cuh(3KB)
--------printer_base.cuh(3KB)
--------axis_base.cu(842B)
--------create.cuh(2KB)
--------nvbench.cuh(1KB)
--------benchmark.cuh(3KB)
--------device_info.cuh(6KB)
----testing()
--------state_generator.cu(48KB)
--------int64_axis.cu(12KB)
--------state.cu(3KB)
--------runner.cu(22KB)
--------type_axis.cu(7KB)
--------sleep_kernel.cuh(1KB)
--------test_asserts.cuh(4KB)
--------cpu_timer.cu(1KB)
--------float64_axis.cu(5KB)
--------string_axis.cu(4KB)
--------cuda_timer.cu(2KB)
--------named_values.cu(5KB)
--------option_parser.cu(51KB)
--------benchmark.cu(9KB)
--------create.cu(22KB)
--------type_list.cu(6KB)
--------CMakeLists.txt(984B)
--------axes_metadata.cu(7KB)
----LICENSE(12KB)
----.clang-format(2KB)
----CMakeLists.txt(823B)
----CODE_OF_CONDUCT.md(4KB)
----README.md(14KB)