如何利用Python 快速找到最大文件

时间:2022-11-07 09:19:51

如何利用Python 快速找到最大文件

现在的电脑差不多都是固态硬盘了,速度很快,但容量不会太大,经常会出现磁盘空间不足的情况,怎么办,删除那些不重要的最大的文件是最有效的办法。

那么如何用找到最大的文件呢?比如说找到最大的前 10 个文件?

思路:我们遍历目录,将文件路径和文件大小作为生成器返回,然后插入大小为 10 的大顶堆,最后将大顶堆的内容打印即可。

借助 Python,代码很简洁:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
import os
import time
 
from os.path import join, getsize
from heapq import nlargest
 
 
def walk_files_and_sizes(start_at: str):
    for root, _, files in os.walk(start_at):
        for file in files:
            path = join(root, file)
            try:
                size = getsize(path)  # bytes
                yield path, size
            except OSError:
                continue
 
 
def largest_files(n: int, start_at: str) -> None:
    MB = 1024 * 1024
    largest = nlargest(n, walk_files_and_sizes(start_at), key=lambda x: x[1])
 
    for path, size in largest:
        print(f'{size//MB} MB {path}')
 
 
 
if __name__ == '__main__':
    start = time.perf_counter()
    largest_files(10, "/Users/aaron/")
    elapsed = time.perf_counter() - start
    print(f'{elapsed} seconds elapsed')

我在自己电脑上跑了下,200 GB 左右的目录,123 秒就跑完了:

如何利用Python 快速找到最大文件

接下来删除不需要的文件就可以了。

如果是 Windows 系统也是可以的:

?
1
largest_files(10, "C:/Users/xxx/")

到此这篇关于如何利用Python 快速找到最大文件的文章就介绍到这了,更多相关Python 快速找最大文件内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://developer.51cto.com/art/202111/689052.htm