经常需要读取某个文件夹下所有的图像文件。
我使用python写了个简单的代码,读取某个文件夹下某个后缀的文件,将文件名生成为文本(csv格式)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
import fnmatch
import os
import pandas as pd
import numpy as np
import sys
InputStra = sys.argv[1]
InputStrb = sys.argv[2]
def ReadSaveAddr(Stra,Strb):
#print(Stra)
#print(Strb)
print("Read :",Stra,Strb)
a_list = fnmatch.filter(os.listdir(Stra),Strb)
print("Find = ",len(a_list))
df = pd.DataFrame(np.arange(len(a_list)).reshape((len(a_list),1)),columns=['Addr'])
df.Addr = a_list
#print(df.head())
df.to_csv('Get.lst',columns=['Addr'],index=False,header=False)
print("Write To Get.lst !")
ReadSaveAddr(InputStra,InputStrb)
|
上面代码保存为:GetLst.py
使用时:
在cmd窗口输入:
1
|
python GetLst.py F:/train/pos *.png
|
发现上面代码不能深入到下一层目录,又做了点修改:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
def ReadSaveAddr2(Stra,Strb):
df = pd.DataFrame(np.arange(0).reshape(0,1),columns=['Addr'])
print(df)
path = InputStra
for dirpath,dirnames,filenames in os.walk(path):
#for filename in filenames:
a_list = fnmatch.filter(os.listdir(dirpath),Strb)
if len(a_list):
dft = pd.DataFrame(np.arange(len(a_list)).reshape((len(a_list),1)),columns=['Addr'])
dft.Addr = a_list
dft.Addr = dirpath + '\\' + dft.Addr#输出绝对路径
frames = [df,dft]
df = pd.concat(frames)
print(df.shape)
df.to_csv('Get.lst',columns='Addr'],index=False,header=False)
print("Write To Get.lst !")
|
以上这篇python读取文件名称生成list的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/masbbx123/article/details/78954294