文件名称:Hands-On-GPU-Programming-with-Python-and-CUDA:Packt发行的《使用Python和CUDA进行动手GPU编程》
文件大小:136KB
文件格式:ZIP
更新时间:2024-06-17 05:33:47
Python
使用Python和CUDA进行动手GPU编程 这是Packt发布的《 进行的代码库。 探索使用CUDA的高性能并行计算 这本书是关于什么的? 使用Python和CUDA进行动手GPU编程必将步入正轨:您将首先学习如何应用阿姆达尔定律,使用代码分析器来识别Python代码中的瓶颈,并设置合适的GPU编程环境。 然后,您将看到如何“查询” GPU的功能以及如何在GPU自身的内存之间来回复制数据数组。 本书涵盖以下激动人心的功能: 直接从Python启动GPU代码 编写有效,高效的GPU内核和设备功能 使用诸如cuFFT,cuBLAS和cuSolver之类的库 使用Nsight和Visual Profiler调试和分析代码 将GPU编程应用于数据科学问题 从头开始构建基于GPU的深度神经网络 探索高级GPU硬件功能,例如经线改组 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代
【文件预览】:
Hands-On-GPU-Programming-with-Python-and-CUDA-master
----Chapter09()
--------deep_neural_network.py(21KB)
--------iris.data(4KB)
----Chapter10()
--------mandelbrot_driver.py(2KB)
--------mandelbrot_ptx.py(1KB)
--------cuda_driver.py(2KB)
--------mandelbrot.cu(2KB)
--------mandelbrot_ctypes.py(1KB)
----LICENSE(1KB)
----Chapter11()
--------shfl_xor.py(641B)
--------ptx_assembly.py(1KB)
--------performance_sum_ker.py(2KB)
--------shfl_sum.py(781B)
--------dynamic_quicksort.py(1KB)
--------sum_ker.py(2KB)
--------vectorized_memory.py(941B)
--------dynamic_hello.py(688B)
--------atomic.py(933B)
----Chapter06()
--------broken_matrix_ker.py(2KB)
--------divergence_test.cu(383B)
--------hello-world_gpu.py(632B)
--------matrix_ker.py(1KB)
--------matrix_ker.cu(3KB)
----Chapter08()
--------thrust_dot_product.cu(1KB)
--------monte_carlo_pi.py(1KB)
--------monte_carlo_integrator.py(4KB)
----README.md(6KB)
----Chapter03()
--------gpu_mandelbrot0.py(2KB)
--------deviceQuery.py(2KB)
--------simple_element_kernel_example0.py(928B)
--------simple_scankernel0.py(284B)
--------time_calc0.py(593B)
--------simple_scankernel1.py(325B)
----Chapter05()
--------multi-kernel_multi-thread.py(2KB)
--------multi-kernel.py(1KB)
--------conway_gpu_streams.py(3KB)
--------single_thread_example.py(544B)
--------multi-kernel_events.py(2KB)
--------multi-kernel_streams.py(1KB)
--------simple_context_create.py(199B)
--------simple_event_example.py(1KB)
--------gpu_mandelbrot_context_sync.py(2KB)
----Chapter02()
--------launch-python-cuda-environment.bat(494B)
----Chapter01()
--------mandelbrot0.py(1KB)
----Chapter04()
--------simple_scalar_multiply_kernel.py(702B)
--------conway_gpu.py(3KB)
--------naive_prefix.py(1KB)
--------conway_gpu_syncthreads.py(3KB)
--------conway_gpu_syncthreads_shared.py(3KB)
--------work-efficient_prefix.py(3KB)
----Chapter07()
--------conv_2d.py(3KB)
--------akshada.jpg(82KB)
--------cublas_gemm_flops.py(1KB)