Artifactory清理未使用的二进制品的最佳实践

时间:2024-03-14 22:00:31

Artifactory充分利用了基于Checksum的存储,但是这种机制无法代替常规的工件清理任务。软件开发可能很杂乱,很多时候Artifactory中的许多工件都从未使用过。

例如,许多CI / CD构建都配置为基于源代码控制提交运行,并且一旦将这些快照构建发送到Artifactory,就永远不会实际下载它们。 

考虑到软件开发的动态性质,大多数组织都有自己的数据保留策略。由您决定可以清除哪些数据,但是内置工具可以覆盖大多数情况。

通常,在Artifactory中使用三种技术来管理工件存储:

限制保留多少SNAPSHOT
清除超大缓存
删除未使用的工

限制保留多少SNAPSHOT

Artifactory具有内置机制来限制构建的快照。该系统的目的是确保在覆盖release工件之前将其从snapshots存储库中升级出来。

Artifactory支持六种存储库类型的最大唯一快照标记:

– Maven  – NuGet
– Gradle  –Ivy
– Docker  – SBT

 

Artifactory使用Artifactory Layout系统跟踪快照的数量。这意味着用户在上载快照工件时需要遵循预定义的模式(大多数客户端会自动处理)。 

例如,此Maven JAR文件被识别为快照运行编号3的一部分:

jfrog / hello / 1.0.5-SNAPSHOT / hello-1.0.5-20190620.224837-3.jar  

Artifactory清理未使用的二进制品的最佳实践

大多数CLI客户端使用特定模式进行上传,Artifactory的默认布局应涵盖这些情况。您可以根据需要自定义这些存储库类型的布局,以处理自定义上传路径。

要在Artifactory中启用此功能,请更新本地存储库设置:

Artifactory清理未使用的二进制品的最佳实践

启用此设置后,在“最大唯一快照数上方进行的上传将在下次构建运行期间删除所有较早的发行版。 

最高的数字将始终是最新版本。

清除超大缓

Artifactory的远程存储库将下载的文件存储在缓存中。通常,保留整个缓存是有益的,因为它可以加快下载速度。但是,如果项目使用的工件有所更改,则值得定期清除缓存。

Artifactory中有支持此功能的内置系统。要启用自动缓存清除,请转到远程存储库菜单的高级部分。 

您可以在“ 未使用的工件清理期部分中添加清理工件之前的小时数:

Artifactory清理未使用的二进制品的最佳实践

这并不意味着工件会在12小时后被删除。相反,它在内部将工件标记为未使用

“ 管理员”->“高级”->“维护 ” 下找到一个单独的作业,称为清理未使用的缓存工件,它将执行清理。默认情况下,此cron作业每天运行一次。

删除未使用的工

通常,Artifactory通常不会自动删除二进制文件。也有例外,例如本文中已讨论的字段。

话虽如此,通过删除长时间未下载的工件可以节省大量存储空间。自动清除未使用的文件的最佳方法是实施Artifactory User Plugin

JFrog开发的最受欢迎的用户插件之一是“ artifactCleanup”插件。该插件在Cron Job上运行,并自动删除“ X”天之内尚未下载的任何工件。

如果您需要进一步自定义插件,则可以在代码中更改Artifactory Query Language语句:

 def aql =“ items.find{” repo“”“ + repoKey +”“” type“” any“” @ cleanup.skip“” true“})。include” repo“” path “名称类型

需要注意的一件事:artifactCleanupDocker Repositories上不起作用。 

Docker映像层作为单独的工件存储在“ image”文件夹中。如果大多数Docker客户端中已经有一个层,则不会经常下载该层。由于行为上的差异,建议使用单独的“ cleanDockerImages”插件。

它依赖manifest.json文件的下载计数,该文件始终在发生“ docker pull”时下载。

 

 

参考资料:

https://jfrog.com/knowledge-base/artifactory-cleanup-best-practices/

 

补充资料:


- AQL清理:

 

https://jfrog.com/blog/advanced-cleanup-using-artifactory-query-language-aql/

 

-清理已有数据:通过 Rest API 清理 90 天内无人下载的 snapshot,或者是 90 天以前的所有 snapshot,这样能够大大减少存储量,加快索引速度。

 

https://www.jfrog.com/confluence/display/RTF/Managing+Disk+Space+Usage#ManagingDiskSpaceUsage-ManualCleanupwiththeRESTAPI

 

-定期清理新增数据:在页面上配置实时清理 snapshot:

 

https://www.jfrog.com/confluence/display/RTF/Managing+Disk+Space+Usage#ManagingDiskSpaceUsage-LimitingtheNumberofSnapshots

 

更多精彩内容可以专注我们的在线课堂

微信搜索公众号:jfrogchina 获取课程通知