大概这样写标题是对的吧。。。
目标:
通过excel目录结构文档生成文件夹树结构。
也就是:
通过下面的excel
生成下面的文档树结构:
方法:
1、分析:一般文档结构都是事先构思好。可以在txt文档里打草稿,粘贴至excel。如下:
这里要注意一个问题:从txt文档 -> excel文档粘贴时,默认如果txt分级为空格,那么在excel里只能是一列。如果在txt分级为tab,那么在excel中各为一列。当然,可以自己进行设置。
2、对excel文档结构进行路劲补全。如图:
3、写py脚本:
#coding:utf-8
import xlrd
import os
import sys
DIRPATH = os.path.dirname(os.path.realpath(__file__))
excelFILE = ur"%s"%sys.argv[1]
#对中文字符转码,避免乱码
encodeText = lambda a : a.encode("gb2312")
def get_data_by_xls(xlsfile):
'''通过xls文档得到数据列表'''
wb = xlrd.open_workbook(xlsfile)
table = wb.sheets()[0]
rows = table.nrows
for i in range(table.nrows):
yield table.row_values(i)
def createDir(dirPath,xList):
'''应用递归,生成文档数'''
try:
rPath = os.path.join(dirPath,encodeText(xList[0]))
try:
os.mkdir(rPath)
rList = xList[1:]
except:
rList = xList[1:]
createDir(rPath,rList)
except:
pass
for i in get_data_by_xls(excelFILE):
if i:
createDir(DIRPATH,i)
print "create dir complete!"
4、运行:
得到结构:
5、总结:
(1)生成文档时需对中文进行转码,不然导致乱码。
(2)生成文件夹时对路径进行递归处理。
(3)在excel文档目录中,各个目录均要补全为完整的路径。
(4)在获取目录列表时,该脚本使用了yield生成器,避免excel目录多占用过多内存的问题,但一般的excel倒是用不到。直接返回列表就OK了。
==============================================================================
人生苦短,我用python!