问题背景:
本来想写一个脚本来处理硬盘里的文件,并进行分类处理,但是发现一个问题,使用python内置os模块里的方法出现一些问题,具体的见示例。
主要使用的方法(python 2.7版本)
示例:
在电脑的d盘下建立两个文件夹,并在两个文件夹下分别建立两个文件及目录:
a: d:\\test\\test.txt
b: d:\测试\测试.txt
分别使用a,b路径来测试os.path的几个方法
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
a = "d:\\test\\test.txt"
b = "d:\测试\测试.txt"
print "a文件是否存在?" + str (os.path.exists(a))
print "a路径是绝对路径?" + str (os.path.isabs(a))
print "a是目录?" + str (os.path.isdir(a))
print "a是文件?" + str (os.path.isfile(a))
print "================================="
print "b文件是否存在?" + str (os.path.exists(b))
print "b路径是绝对路径?" + str (os.path.isabs(b))
print "b是目录?" + str (os.path.isdir(b))
print "b是文件?" + str (os.path.isfile(b))
|
执行后得到的结果是:
1
2
3
4
5
6
7
8
9
|
a文件是否存在?true
a路径是绝对路径?true
a是目录?false
a是文件?true
= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
b文件是否存在?false
b路径是绝对路径?true
b是目录?false
b是文件?false
|
我们可以预想一下,这两个路径执行后的结果应该是一致的,当然结果并不是一致的,因为什么呢?刚刚的执行结果使用的是ide,我们使用python的交互式命令行来试试
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
>>> a = "d:\\test\\test.txt"
>>> print "a文件是否存在?" + str (os.path.exists(a))
a文件是否存在?true
>>> print "a路径是绝对路径?" + str (os.path.isabs(a))
a路径是绝对路径?true
>>> print "a是目录?" + str (os.path.isdir(a))
a是目录?false
>>> print "a是文件?" + str (os.path.isfile(a))
a是文件?true
>>> b = "d:\测试\测试.txt"
>>> print "b文件是否存在?" + str (os.path.exists(b))
b文件是否存在?true
>>> print "b路径是绝对路径?" + str (os.path.isabs(b))
b路径是绝对路径?true
>>> print "b是目录?" + str (os.path.isdir(b))
b是目录?false
>>> print "b是文件?" + str (os.path.isfile(b))
b是文件?true
|
这时候就有尴尬了,这里执行的结果是一致的,所以要么是ide问题,要么是编码问题。通过实验最后证明是编码的问题
1
2
3
4
5
6
7
8
9
10
11
12
13
|
import os
a = "d:\\test\\test.txt"
b = u "d:\测试\测试.txt"
print "a文件是否存在?" + str (os.path.exists(a))
print "a路径是绝对路径?" + str (os.path.isabs(a))
print "a是目录?" + str (os.path.isdir(a))
print "a是文件?" + str (os.path.isfile(a))
print "b文件是否存在?" + str (os.path.exists(b))
print "b路径是绝对路径?" + str (os.path.isabs(b))
print "b是目录?" + str (os.path.isdir(b))
print "b是文件?" + str (os.path.isfile(b))
|
执行结果
1
2
3
4
5
6
7
8
9
|
a文件是否存在?true
a路径是绝对路径?true
a是目录?false
a是文件?true
= = = = = = = = = = = = = = = = = = = = = = = = = =
b文件是否存在?true
b路径是绝对路径?true
b是目录?false
b是文件?true
|
好了,现在一致了,代码中可以看出,只是在b的路径上加了一个u(表示将字符串变成了unicode编码的字符串了),由此可以看出在python2.7版本里中文编码问题有多么严峻,这种仅仅加u的方式肯定不行,建议使用python的unicode方法来转化。
解决方法:
1
2
|
b = "d:\测试\测试.txt"
b = unicode (b, 'utf-8' )
|
总结:中文问题,应该是python2.7比较头疼的问题,3以上应该比较好,不用担心这个问题,随后在处理路径上或其他涉及中文内容的时候,不管是英文还是中文,都可以加上unicode(content, encoding)一步来确保无误,希望本文能帮到你。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/u013948858/article/details/78962651