用 Python 快速找到最大的文件

时间:2021-10-14 00:34:58

现在的电脑差不多都是固态硬盘了,速度很快,但容量不会太大,经常会出现磁盘空间不足的情况,怎么办,删除那些不重要的最大的文件是最有效的办法。

用 Python 快速找到最大的文件

那么如何用找到最大的文件呢?比如说找到最大的前 10 个文件?

思路:我们遍历目录,将文件路径和文件大小作为生成器返回,然后插入大小为 10 的大顶堆,最后将大顶堆的内容打印即可。

借助 Python,代码很简洁:

  1. importos
  2. importtime
  3. fromos.pathimportjoin,getsize
  4. fromheapqimportnlargest
  5. defwalk_files_and_sizes(start_at:str):
  6. forroot,_,filesinos.walk(start_at):
  7. forfileinfiles:
  8. path=join(root,file)
  9. try:
  10. size=getsize(path)#bytes
  11. yieldpath,size
  12. exceptOSError:
  13. continue
  14. deflargest_files(n:int,start_at:str)->None:
  15. MB=1024*1024
  16. largest=nlargest(n,walk_files_and_sizes(start_at),key=lambdax:x[1])
  17. forpath,sizeinlargest:
  18. print(f'{size//MB}MB{path}')
  19. if__name__=='__main__':
  20. start=time.perf_counter()
  21. largest_files(10,"/Users/aaron/")
  22. elapsed=time.perf_counter()-start
  23. print(f'{elapsed}secondselapsed')

我在自己电脑上跑了下,200 GB 左右的目录,123 秒就跑完了:

用 Python 快速找到最大的文件

接下来删除不需要的文件就可以了。

如果是 Windows 系统也是可以的:

  1. largest_files(10,"C:/Users/xxx/")

最后的话

本文的方法非常实用,可以收藏,说不定那天,这个小工具就帮你解决了大问题。

原文链接:https://mp.weixin.qq.com/s?__biz=MzU0OTg3NzU2NA==&mid=2247489230&idx=1&sn=a76e39dca477049d96ed21421b7e5c9b&chksm=fba8749dccdffd8b163490e9bc611ddae6631686f13573e0668b187cb8ede136efcd8a6f21d1&mpshare=1&