在实际的算法与程序开发中,经常需要面对的场景就是对同一目录内的文件进行批量操作。
并且很多时候目录中的文件明明是有规律的,同时希望程序在进行处理时也是按照一定的顺序进行。
方法 1
1
2
3
4
5
6
7
8
|
>>> import os
>>> fileList = os.listdir( 'TestDir' )
>>> fileList
[ 'test1.txt' , 'test10.txt' , 'test11.txt' , 'test2.txt' , 'test23.txt' , 'test28.txt' ]
>>> fileList.sort(key = lambda x: int (x[ 4 : - 4 ]))
>>> fileList
[ 'test1.txt' , 'test2.txt' , 'test10.txt' , 'test11.txt' , 'test23.txt' , 'test28.txt' ]
>>>
|
方法 2
1
2
3
4
5
6
7
8
9
|
>>> import os
>>> import natsort
>>> fileList = os.listdir( 'TestDir' )
>>> fileList
[ 'test1.txt' , 'test10.txt' , 'test11.txt' , 'test2.txt' , 'test23.txt' , 'test28.txt' ]
>>> fileList = natsort.natsorted(fileList)
>>> fileList
[ 'test1.txt' , 'test2.txt' , 'test10.txt' , 'test11.txt' , 'test23.txt' , 'test28.txt' ]
>>>
|
补充:python对目录下的文件排序问题
1.按照时间来排序
1
2
3
4
5
6
7
8
9
10
11
|
def get_file_list(file_path):
dir_list = os.listdir(file_path)
if not dir_list:
return
else :
# 注意,这里使用lambda表达式,将文件按照最后修改时间顺序升序排列
# os.path.getmtime() 函数是获取文件最后修改时间
# os.path.getctime() 函数是获取文件最后创建时间
dir_list = sorted (dir_list,key = lambda x: os.path.getmtime(os.path.join(file_path, x)))
# print(dir_list)
return dir_list
|
2.获取最后修改时间的文件路径
1
2
3
4
5
6
7
|
import os
url = 'D:\PycharmProjects\Ambulance_Api\logs'
lists = os.listdir(url)
print (lists)
lists.sort(key = lambda fn: os.path.getmtime(url + '\\' + fn))
filepath = os.path.join(url,lists[ - 1 ])
print (filepath)
|
3.按照文件名字来排序
1)用库函数sorted()对字符串排序,它的对象是字符
2)用函数sort()对数字排序,它的对象是数字,如果读取文件的话,需要进行处理(把文件后缀名‘屏蔽')
1
2
3
4
5
6
7
|
import os
img_path = './img/'
img_list = sorted (os.listdir(img_path)) #文件名按字母排序
img_nums = len (img_list)
for i in range (img_nums):
img_name = img_path + img_list[i]
print (img_name)
|
sort函数中用到了匿名函数(key = lambda x:int(x[:-4])),其作用是将后缀名'.jpg'“屏蔽”(因为‘.jpg'是4个字符,所以[:-4]的含义是从文件名开始到倒数第四个字符为止)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/am290333566/article/details/93485128