文件名称:archive_profiler:用于生成各种Web档案的配置文件的脚本
文件大小:601KB
文件格式:ZIP
更新时间:2024-06-09 07:30:54
Python
存档探查器 用于生成各种Web存档配置文件的脚本,这些配置文件将保存在“。 运行Profiler脚本 要设置和运行事件探查器脚本,请按照下列步骤操作: 克隆存储库。 $ git clone git@github.com:oduwsdl/archive_profiler.git 更改工作目录。 $ cd archive_profiler 从需求文件安装依赖项(如有必要,在pip命令前添加sudo )。 $ pip install -r requirements.txt 在附带的样本cdx文件上运行脚本。 $ python ./main.py cdx/*.cdx 如果脚本没有错误地完成,则应将profiles文件保存在配置profiles文件夹中。 现在,请更新config.ini文件以反映您的收藏。 然后尝试对您自己的cdx文件运行事件探查器。 这将为您的集合生成配置文件,
【文件预览】:
archive_profiler-master
----profiling_benchmarker.py(4KB)
----cdx()
--------index-3.cdx(4.6MB)
--------index-2.cdx(156KB)
--------index-1.cdx(18KB)
----profile_merger.py(2KB)
----summarize.r(4KB)
----uri_sample_profiler.py(378B)
----test_suburi_generator.py(8KB)
----profile.py(3KB)
----lanl_profiler.py(3KB)
----mainold.py(3KB)
----extract_suburi_generator.py(2KB)
----policy_summarize.r(7KB)
----config.ini(678B)
----extract_benchmark_analyzer.py(2KB)
----main.py(3KB)
----key_generator.py(5KB)
----prefix_suffix_profiler.py(2KB)
----json()
--------README.md(52B)
----requirements.txt(62B)
----configold.ini(990B)
----benchmark()
--------summarize.r(3KB)
--------README.md(49B)
----benchmark_analyzer.py(2KB)
----LICENSE(1KB)
----policy_benchmark_analyzer.py(2KB)
----README.md(1KB)
----cdx_extract_profiler.py(4KB)
----suburi_generator.py(773B)
----urir_growth_analyze.r(2KB)
----extract_summarize.r(7KB)
----newmain.py(3KB)
----cdx_transformation_analyze.r(420B)
----.gitignore(739B)
----extract_profiling_benchmarker.py(5KB)
----keyword_sample_profiler.py(393B)
----policy_profiling_benchmarker.py(5KB)
----cdx_profiler.py(5KB)