Python遍历某目录下的所有文件夹与文件路径

时间:2022-11-17 23:13:36

本文与《【java】读取其下所有文件夹与文件的路径》为姊妹篇,主要讲述python对于文件信息的读取操作。

python对于文件信息的读取操作,在其固有类os中。

下面以读取f盘下的所有文件夹作为例子说明这个问题:

Python遍历某目录下的所有文件夹与文件路径

python对于文件夹的遍历有两种写法,一种是直接利用其封装好的walk方法直接操作。
这是python做得比java优势的地方:

?
1
2
3
4
5
6
7
# -*-coding:utf-8-*-
import os
for root,dirs,files in os.walk("f:\\"):
 for dir in dirs:
  print os.path.join(root,dir).decode('gbk').encode('utf-8');
 for file in files:
  print os.path.join(root,file).decode('gbk').encode('utf-8');

运行效果如下:

Python遍历某目录下的所有文件夹与文件路径

上述程序,将os.walk读取到的所有路径root、目录名dirs与文件名files,也就是三个文件数组利用foreach循环输出。

join方法就是讲其路径与目录名或者文件名连接起来,组成一个完整的目录。

后面的.decode('gbk').encode('utf-8');方法主要是给eclipse下的pydev控制台用的,如果不加控制台的输出会出现乱码,但是,如果你的python程序是要拉到windows的控制台cmd,使用python xx.py运行的话,请不要加这段编码方法,同时去掉开头的# -*-coding:utf-8-*-。因为cmd是使用gb2312简体中文编码的,而不是像linux的终端是utf-8编码。

也可以根据java的递归思想,写成以下的形式:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
# -*-coding:utf-8-*-
 
import os;
files = list();
def dirall(pathname):
 if os.path.exists(pathname):
  filelist = os.listdir(pathname);
  for f in filelist:
   if f=="$recycle.bin" or f=="system volume information":
    continue;
   f=os.path.join(pathname,f);
   if os.path.isdir(f): 
    dirall(f);    
   else:
    dirname=os.path.dirname(f);
    basename=os.path.basename(f);
    if dirname.endswith(os.sep):
     files.append(dirname+basename);
    else:
     files.append(dirname+os.sep+basename);
 
 
dirall("f:\\");
for f in files:
 print f.decode('gbk').encode('utf-8');

运行效果如下:

Python遍历某目录下的所有文件夹与文件路径

当然,这种形式有其弊端,就是不能遍历一些系统保留文件夹,如$recycle.bin、system volume information等,如果不写判断条件,会导致下面的读取出错。因此,以后遍历文件夹的时候,还是建议时候上面的os.walk的方式。

不过,我们可以从上面的程序看到几个常见的用法,os.sep能够直接返回文件分隔符/或者\\、、os.path.join(文件所在目录的路径、文件名)能把文件所在目录的路径与文件名连接起来,os.path.isdir(完整路径)能判断是否是目录,endswith("xx")方法能判断字符串是否以xx结束的。os.path.dirname()能得到文件所在目录的路径,os.path.basename()能得到文件名,os.listdir(路径)能得到相应的文件列表,等等。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

原文链接:http://blog.csdn.net/yongh701/article/details/46907383