文件名称:partner-xor:Partner-XOR合并的CheckpointRestart库
文件大小:54KB
文件格式:ZIP
更新时间:2024-03-16 11:57:06
distributed-systems parallel-computing distributed-computing checkpoint-restart erasure-coding
组合检查点/重启库 该库为在多个计算节点(计算机)上运行的高性能计算(HPC)应用程序提供了稳定,可扩展,快速的Checkpoint / Restart方法。 XOR擦除编码和伙伴冗余在两层中分层组合。 通过将检查点和XOR奇偶校验数据从上层复制到下层的伙伴节点,可以确保容错能力和故障恢复的灵活性。 编译安装 git clone https://github.com/gongotar/partner-xor.git mkdir partner-xor/build && cd partner-xor/build cmake -DCMAKE_INSTALL_PREFIX: < installation> .. make make install (可选)在执行make install之前,您还可以使用make test执行make test 。 请注意,这可能需要一段时间。
【文件预览】:
partner-xor-main
----example()
--------heatdis_combined.c(5KB)
--------config.ini(302B)
--------heatdis.h(487B)
--------CMakeLists.txt(214B)
----tests()
--------system_test.c(1KB)
--------cp_recover_integration.h(1KB)
--------config.ini(302B)
--------xor_units.h(817B)
--------CMakeLists.txt(4KB)
--------test_header.h(2KB)
--------integration_test.c(2KB)
--------unit_test.c(1KB)
--------cp_recover_integration.c(9KB)
--------xor_units.c(23KB)
--------test_runner.sh(2KB)
--------cp_rec_system.c(2KB)
--------cp_rec_system.h(952B)
----include()
--------combined.h(1KB)
--------globals.h(2KB)
----LICENSE(11KB)
----src()
--------ini.h(5KB)
--------ini.c(9KB)
--------mpi_utils.c(1KB)
--------xor_struct.c(5KB)
--------common.c(6KB)
--------common.h(1KB)
--------checkpoint_utils.c(9KB)
--------mpi_utils.h(880B)
--------checkpoint_utils.h(1KB)
--------recovery_utils.c(17KB)
--------xor_struct.h(1013B)
--------naming_utils.h(882B)
--------CMakeLists.txt(311B)
--------extra.h(977B)
--------combined.c(10KB)
--------extra.c(2KB)
--------recovery_utils.h(1KB)
--------naming_utils.c(1KB)
----.gitignore(781B)
----CMakeLists.txt(356B)
----README.md(6KB)