python进阶05 常用问题库(1)json os os.path模块
一、json模块(数据交互)
web开发和爬虫开发都离不开数据交互,web开发是做网站后台的,要跟网站前端进行数据交互
1、什么是json
#json全名叫JavaScript Object Notation(即 JavaScript对象标记语言)
#它是JavaScript字面量标记的子集
#前段与后端进行数据交互,其实就是JS和python进行交互;传输的时候只能传纯文本;json字符串是一个纯文本文件
2、json注意事项
#1、名称必须用双引号("")来包括
#2、值可以是双引号包括的字符串、数字、true、false、null、JavaScript数组,或子对象 #python与json转换规则 python json
字典 对象
列表或元组 数组
字符串 字符串
int或float 数字
True或False true或false
None null
3、如何操作json
#需要导入一个模块
import json #json模块API(API:应用程序接口)有下面4个接口
json.dumps(obj)# 将obj这个对象变成json字符串
json.loads
json.dump
json.load #如何知道该接口的含义:输入json.dumps,然后按住Ctrl+鼠标左键,可以看到基本说明 ##json.dumps(obj)# 将obj这个对象变成json字符串,字典里面嵌套字典同样可以转换 import json data={'name':'Tuple','age':18,'list':[1,2,3],'True':True,'False':False,'None':None} json.data=json.dumps(data)#返回一个字符串
print(type(json.data))
print(json.data)
#输出{"name":'Tuple',"age":18,"list":[1,2,3],'"True":true,"False":false,"None":null}# 按照上面的规则转换 ##json.loads(s) #将json字符串s转化为python的数据类型,由于json不认识元组,转化回来的只能是列表,但数据是不会变的
py_dict=json.loads(json.data)
print(py_dict)
#输出{'name':'Tuple','age':18,'list':[1,2,3],'True':True,'False':False,'None':None}
二、文件与路径操作
#网站上的文件其实是静态文件
#下载的时候需要通过python
#os模块 问题引入:
#python需要经常处理文件、目录及路径的问题
#对于文件与目录,我们必须要掌握哪些基本操作?基本的都会学习,不基本的需要自学
#对于路径,我们必须要能够处理哪些问题?基本操作
#如何用Python去做?
三、os模块的目录及文件操作
1、显示当前路径 os.getcwd
import os pwd=os.getcwd() #相当于linux的pwd,显示当前路径
2、展示当前目录内容 os.listdir(path)
import os content=os.listdir()#展示当前目录内容,相当于linux 的ls -a content=os.listdir('/home/pyvip/')#也可以看具体路径下的内容
3、改变当前路径 os.chdir(path)
import os
print(os.chdir('..')) #相当于cd
4、判断是否是一个目录os.path.isdir和文件os.path.isfile
#由于他不区分文件和目录,所有需要判断
print(os.path.isdir('/home/pyvip/.bashrc'))#判断是否是个目录,输出True
print(os.path.isfile('/home/pyvip/.bashrc'))#判断是否是个文件,输出False
5、创建目录os.mkdir
import os
test=os.mkdir('test.txt')
print(test) #输出['test.txt'] None ,因为os.mkdir('test.txt')是一个函数,运行完了没有返回值,所以会输出None,而'test.txt'是一个目录,而不是一个txt文件 for i in os.listdir():
print(i,os.path.isdir(i)) #通过这个循环来遍历这个目录下的所有文件是否是文件夹#输出test.txt True 是一个文件夹
6、删除目录os.rmdir
os.rmdir(path) #输入一个目录即可
7、删除文件os.remove
os.remove(parh)#输入一个目录即可
8、重命名os.rename
os.rename(src,dst)
os.rename('test.txt','../text.txt') src:sourse #源
dst:destination# 目的地
路径操作os.path模块
1、路径拼接 os.path.join
#我想看.bashrc这个东西是个文件还是文件夹,但是我只有一个完整路径,没有斜杠的路径,这就可以用os.path.join
print(os.path.join(os.getcwd(),'.bashrc'))#输出/home/pyvip/.bashrc os.path.join('home','pyvip','US16')#中间不管有没有正斜杠,他都会帮你处理好
#输出 /home/pyvip//bashrc print(os.path.join('home/','/pyvip','US16'))#/pyvip/US16 原因是pyvip前面加个/,他会认为这是根目录,前面会被忽略掉
2、所在目录、父级目录 os.path.dirname
import os
pwd=os.getcwd()
print(pwd) #当前目录
print(os.path.dirname(pwd)) #父级目录
3、基本短路径 os.path.basename
#有个完整路径,想看看最底层的文件名
import os
print(os.path.basename('/home/pyvip/.bashrc'))#输出.bashrc
4、绝对路径os.path.abspath
import os
os.path.abspath('myproject/ttt.py')#想知道ttt.py的绝对路径,给的是相对路径
#输出的是/home/pyvip/Us16/myprojext/ttt.py(绝对路径)
5、相对路径os.path.relpath
6、规范化路径os.path.normpath
print(os.path.normpath('/home/vip/../pyvip'))#输出/home/pyvip
7、是否是绝对路径 os.path.isabs
8、资源大小os.path.getsize
os.path.getsize('ttt.py')# 输出158 这个158是字节,bit是位,byte是字节,1字节是8位,其他都是1024的翻倍
9、资源时间os.path.getctime
os.path.getatime('ttt.py') #access 访问
os.path.getatime('ttt.py') #create 创建
os.path.getatime('ttt.py') #modify 修改 #输出 1519823306.8060257 这是时间戳,即从1970.1.1经过的秒数
10、资源是否存在os.path.exists
import os
print(os.path.exists('/home/pyvip/us10'))#如果不存在,那么久创建一个文件夹
三、补充
1、json.dump 与json.load
#作用:将一个字典,转化成一个json文件(里面存的就是一个字符串,就是那个json) import json data={'name':'tuple','age':18}
with open('xx.json','w') as fp:
json.dump(data,fp) #实际工作中,是不会去生成文件的,在框架里面,直接返回给一个浏览器 with open('xx.json','r') as fp
py_dict=json.load(fp)#直接读出文件的内容 print(py_dict)
2、如何查资料
#打开docs.python.org/3/
#其中Library Reference是 内置库
#Tutoral 入门教程(不适合我们) #打开内置库,按下Ctrl+F,输入需要找的内容