最近才开始学习Python语言,但就发现了它很多优势(如语言简洁、网络爬虫方面深有体会).我主要是通过《Python基础教程》和"51CTO学院 智普教育的python视频"学习,在看视频中老师讲述函数知识的时候觉得非常不错,所以就写了第一篇Python学习的文章分享给大家.主要内容:
1.Python安装与基本输入输出,print()函数和raw_input()函数简单用法.
2.我根据视频中学到的知识,讲解函数的基本知识:
(1).系统提供内部函数:字符串函数库、数学函数库、网络编程函数库、OS函数库
(2).第三方提供函数库:讲解如何安装httplib2第三方函数库,再做了个简单的网页爬虫例子
(3).用户自定义函数:讲解无返回类型、有形参、预设值参数等自定义函数
3.同时网络编程中与C#以前学过的进行了简单对比,发现python确实有很多优点,而且很方便强大.
PS:文章中引用了很多视频中的知识、书籍知识和自己的知识,感谢那些作者和老师,希望文章对大家有所帮助,才开始学习python知识,如果文章中有错误或不足之处,还请海涵,也希望大家提出意见与君共勉.勿喷~
一. Python安装及输入输出函数
python解释器在Linux中可以内置使用安装,windows中需要去www.python.org官网downloads页面下载(如python-2.7.8.amd64.msi),安装Python集成开发环境(Python Integrated Development Environment,IDLE)即可.运行程序输入">>>print 'hello world'"则python解释器会打印输出"hello world"字符串. 如下:
然后讲述Python程序的基本框架是"输入-处理-输出",而输入输出函数如下:
1.print()函数
函数用于输出或打印整型、浮点型、字符串数据至屏幕,如print(3)、print(12.5)、print('H').它输出变量格式"print(x)或print x",而且可以输出多个变量"print x,y,z".并且支持格式化输出数据,调用format()函数,其格式为:
print(format(val,format_modifier)) 其中val表示值,format_modifier表示格式字.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
#简单输出
>>> print ( 12.5 )
12.5
>>> print ( "eastmount" )
eastmount
#输出"123.46",6.2表示输出6位,小数点后精度2位,输出最后一位6是四舍五入的结果
>>> print ( format ( 123.45678 , '6.2f' ))
123.46
#输出"口口口123",采用右对齐补空格方式输出总共6位
>>> print ( format ( 123.45678 , '6.0f' ))
123
#输出"123.456780000"小数点后面9位,超出范围会自动补0
>>> print ( format ( 123.45678 , '6.9f' ))
123.456780000
#输出"34.56%"表示打印百分率
>>> print ( format ( 0.3456 , '.2%' ))
34.56 %
|
2.raw_input()函数
内建函数从sys.stdin接受输入,读取输入语句并返回string字符串.输入以换行符结束,通过help(raw_input)可以查找帮助,常见格式为:
s = raw_input([prompt]) 参数[prompt]可选,用于提示用户输入.
1
2
3
4
5
6
7
8
|
#输入函数
>>> str1 = raw_input ( "please input a string:" )
please input a string:I love you
>>> print (str1)
I love you
#查看str1数据类型
>>> type (str1)
< type 'str' >
|
注意raw_input()与input()的区别:(1).input支持合法python表格式"abc",字符串必须用引号括起,否则会报错"NameError: name 'abc' is not defined",而raw_input()任何类型输入都可接受; (2).raw_input()将所有输入作为字符串,返回string,而input()输入纯数字时具有自己的特性,返回输入的数字类型int或float.举例解释如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
#SyntaxError语法错误
>>> str1 = input ( "input:" )
input :abc
Traceback (most recent call last):
File "<stdin>" , line 1 , in <module>
File "<string>" , line 1 , in <module>
NameError: name 'abc' is not defined
#正确输入输出
>>> str1 = input ( "input:" )
input : "I love you"
>>> print str1
I love you
#input纯数字 数据类型
>>> weight = input ( "weight:" )
weight: 12.5
>>> type (weight)
< type 'float' >
#raw_input 数据类型均为str
>>> age = raw_input ( "age:" )
age: 20
>>> type (age)
< type 'str' >
|
二. 函数之系统提供内部函数
python提供的系统内部库函数主要讲述一下四种类型:(引自视频,只简单介绍)
1.字符串函数库
通过help(str)可以查询字符串函数库,其中查询过程中"-More-"输入回车实现滚动信息,输出"q"退出帮助(Quit).字符串函数大家都比较熟悉,无论C\C++\C#\Java都学过很多,而且基本大同小异.如:
islower()函数判断字符串是否大小写,一个大写返回False.前面使用的format()函数、求字符串长度len()函数均属于字符串函数库,help(str.replace)可以查询具体函数用法,该函数用于新字符串替换旧字符串.
1
2
3
4
5
6
7
8
9
10
11
12
|
#判断字符串是否小写
>>> str1 = "Eastmount"
>>> str1.islower()
False
#字符串替换
>>> str2 = 'adfababdfab'
>>> str2.replace( 'ab' , 'AB' )
'adfABABdfAB'
#字符串求长度
>>> print ( len (str2))
11
>>>
|
2.数学函数库
使用数学函数库时需要注意的是导入库"import math",该库中函数我们也非常熟悉,如sin()求正弦,cos()求余弦,pow(x,y)计算x的y次幂,如pow(3,4)=3*3*3*3,python中也可以使用3**4表示.help(math)中可以查看详细信息,而且库中定义了两个常数DATA:
e = 2.718281... pi = 3.14159265...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
#导入math库
>>> import math
>>> print math.pi
3.14159265359
#计算sin30度
>>> val = math.sin(math.pi / 6 )
>>> print val
0.5
#pow函数
>>> math. pow ( 3 , 4 )
81.0
>>> 3 * * 4
81
>>> help (math. pow )
Help on built - in function pow in module math:
pow (...)
pow (x, y)
Return x * * y (x to the power of y).
>>>
|
3.网络编程库
系统提供内部库函数中网络编程库,我此处仅仅举个简单例子,socket(套接字网络编程)获取主机ip地址这是非常常见的运用,我将与C#网络编程进行简单对比.后面的博文中将详细讲述python网络编程.
1
2
3
4
|
>>> import socket
>>> baiduip = socket.gethostbyname( 'www.baidu.com' )
>>> print baiduip
61.135 . 169.125
|
其中socket编程很常用,gethostbyname()返回指定主机ip,而C#中获取百度网址的ip地址代码如下所示.代码中可能会出现"警告:Dns.GetHostByName()函数已过时",可替换为IPHostEntry myHost = Dns.GetHostEntry(www.baidu.com).输出:
61.135.169.121
61.134.169.125
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
/ / 引用新命名空间
using System.Net;
namespace GetIp
{
class Program
{
static void Main(string[] args)
{
/ / 获取DNS主机名的DNS信息
IPHostEntry myHost = Dns.GetHostByName( "www.baidu.com" );
IPAddress[] address = myHost.AddressList;
for ( int index = 0 ; index < address.Length; index + + )
{
Console.WriteLine(address[index]);
}
Console.ReadKey();
}
}
}
|
4.操作系统(OS)函数库
操作系统库函数引用"import os",举例获取当前工作路径和先死当前路径下的文件和目录.使用os.system("cls")可以实现清屏功能.安装python目录Lib文件夹下含有很多py库文件供使用.
1
2
3
4
5
6
7
8
9
10
11
|
>>> import os
#获取当前工作路径
>>> current = os.getcwd()
>>> print current
G:\software\Program software\Python\python insert
#获取当前路径下的文件和目录
>>> dir = os.listdir(current)
>>> print dir
[ 'DLLs' , 'Doc' , 'h2.txt' , 'include' , 'Lib' , 'libs' , 'LICENSE.txt
', ' NEWS.txt ', ' python.exe ', ' pythonw.exe ', ' README.txt ', ' tcl ', ' Tools']
>>>
|
三. 函数之第三方提供函数库及安装httplib2模块过程
(一).安装第三方函数库httplib2过程
Python中第三方开源项目中提供函数库供我们使用,比如使用httplib2库函数.在Linux中直接使用"easy_install httplib2"搜索自动安装,Windows下python开发工具IDLE里安装httplib2模块的过程如下(其他模块类似).
1.下载httplib2模块"https://code.google.com/p/httplib2/"到指定目录,解压压缩包"httplib2_0.8.zip"到某目录下,如果该网址google访问失败,可以到此处下载:
2.配置python运行环境
右键"计算机"->"属性"->在"系统"中选择"高级系统设置"->在"系统属性"中"高级"选择"环境变量"
在系统环境变量Path后添加python安装目录"G:\software\Program software\Python\python insert"
3.在dos下安装httpLib2
管理员模式运行cmd,利用cd命令进入httplib2_0.8.zip解压目录,输入"python settup.py install",如下图所示安装成功.
4.使用httplib2
如果httplib2库函数没有安装成功,"import httplib2"会提示错误"ImportError: No module named httplib2".否则安装成功,举例如下.
1
2
3
4
5
6
7
8
9
|
import httplib2
#获取HTTP对象
h = httplib2.Http()
#发出同步请求并获取内容
resp, content = h.request( "http://www.csdn.net/" )
#显示返回头信息
print resp
#显示网页相关内容
print content
|
输出头信息:
1
|
{'status': '200', 'content-length': '108963', 'content-location': 'http://www.csdn.net/', .... 'Fri, 05 Sep 2014 20:07:24 GMT', 'content-type': 'text/html; charset=utf-8'}
|
(二).简单网页爬虫示例
使用第三方函数库时的具体格式为module_name.method(parametes) 第三方函数名.方法(参数).
讲述一个引用web库,urllib库访问公网上网页,webbrowser库调用浏览器操作,下载csdn官网内容并通过浏览器显示的实例.
1
2
3
4
5
6
|
import urllib
import webbrowser as web
url = "http://www.soso.com"
content = urllib.urlopen(url).read()
open ( "soso.html" , "w" ).write(content)
web.open_new_tab( "soso.html" )
|
它会输出True并在浏览器中打开下载的静态网页.引用import webbrowser as web使用web,也可以直接引用,使用时"module_name.method"即可.
content = urllib.urlopen(url).read()表示打开url并读取赋值
open("soso.html","w").write(content)表示在python安装目录写静态soso.html文件
web.open_new_tab("soso.html")表示打开该静态文件新标签.
同样可以使用web.open_new_tab('http://www.soso.com')直接在浏览器打开动态网页.效果如下图所示:
四. 函数之自定义函数
1.无返回值自定义函数
其基本语法格式如下:
1
2
3
4
|
<span style = "color: #ff0000" ><strong> def function_name([parameters]): < / strong>< / span> 函数名([参数]),其中参数可有可无
<span style = "color: #ff0000" ><strong>(TAB) statement1
(TAB) statement2
< / strong>< / span> <span style = "color: #ff0000" ><strong> ...< / strong>< / span>
|
注意:
(1).自定义函数名后面的冒号(:)不能省略,否则报错"invalid syntax",而且无需像C语言一样加{};
(2).函数里每条语句前都有缩进TAB,否则会报错"There's an error in your programs:expected an indented block",它的功能相当于区分函数里的语句与函数外的语句.
举例:打开IDLE工具->点击栏"File"->New File新建文件->命名为test.py文件,在test文件里添加代码如下.
1
2
3
4
5
6
7
8
9
|
def fun1():
print 'Hello world'
print 'by eastmount csdn'
print 'output'
fun1()
def fun2(val1,val2):
print val1
print val2
fun2( 8 , 15 )
|
保存,在test.py文件里点击Run->Run Module.输出结果如下图所示,其中fun1()函数无形参自定义函数,fun2(val1,val2)是有形参自定义函数,fun2(8,15)为函数的调用,实参8和15.
2.有返回值自定义函数
其基本语法格式如下:
1
2
3
4
5
|
<strong> < / strong> def funtion_name([para1,para2...paraN])
statement1
statement2
....
return value1,value2...valueN
|
返回值支持一个或多个返回,需要注意的是自定义函数有返回值,主调函数就需要接受值(接受返回的结果).同时在定义变量时可能sum这些可能是关键字(注意颜色),最好使用不是关键字的变量.举例:
1
2
3
4
5
6
7
8
9
10
11
12
|
def fun3(n1,n2):
print n1,n2
n = n1 + n2
m = n1 - n2
p = n1 * n2
q = n1 / n2
e = n1 * * n2
return n,m,p,q,e
a,b,c,d,e = fun3( 2 , 10 )
print 'the result are ' ,a,b,c,d,e
re = fun3( 2 , 10 )
print re
|
输出结果如下,其中需要注意的是参数一一对应,在除法中2/10=0,**幂运算2的10次方=1024.而使用re=fun3(2,10)直接输出的结果成为元组,后面会详细讲述,(12,-8,20,0,1024)元组中re[0]存储12,re[1]存储-8,依次~
1
2
3
4
|
2 10
the result are 12 - 8 20 0 1024
2 10
( 12 , - 8 , 20 , 0 , 1024 )
|
3.自定义函数参数含预定义
预设值的基本格式如下:
1
2
3
4
5
|
def function_name(para1,para2...parai = default1...paran = defaultn)
statement1
statement2
...
return value1,value2...valuen
|
其中需要注意的是预定义值得参数不能先于无预定义值参数,举个例子讲解.
1
2
3
4
5
6
7
8
|
def fun4(n1,n2,n3 = 10 ):
print n1,n2,n3
n = n1 + n2 + n3
return n
re1 = fun4( 2 , 3 )
print 'result1 = ' ,re1
re2 = fun4( 2 , 3 , 5 )
print 'result2 = ' ,re2
|
输出结果如下图所示,预定义的参数在调用时,实参可以省略,也可以替换默认定义的预定义值.
1
2
3
4
|
2 3 10
result1 = 15
2 3 5
result2 = 10
|
其中如果函数定义为def fun4(n3=10,n2,n1)就会报错"non-default argument follows default argument"(没预定义的参数在预定义参数的后面),所以定义函数时需要注意该点.
同时需要注意函数调用时的赋值顺序问题,最好采用一对一复制,也可以函数调用中给出具体形参进行赋值,但需要注意的是在函数调用过程中(使用函数时),有预定义值的参数不能先于无预定义值参数被赋值.
如例子中自定义函数def fun4(n1,n2,n3=10),在调用时可以:
(1).s=fun4(2,3)省略预定义参数,它是一对一赋值,其中n1赋值2、n2赋值3、n3赋值10(预定义)
(2).s=fun4(4,n2=1,n3=12)它也是一对一赋值,而且预定义值n3替换为12
(3).s=fun4(n2=1,n1=4,n3=15)它的顺序与定义函数没有对应,但是调用时给出具体对应也行
下面的情况就会出现所述的"有预定义值的参数先于无预定义值参数被赋值"错误:
(1).s=fun4(n3=12,n2=1,4)此时会报错"non-keyword arg after keyword arg",它不能指定n1=4,就是没有指定预定值n1=4在有预定值n3=12,n2=1之后,如果改成s=fun4(4,n2=1,n3=12)或s=fun4(4,n3=12,n2=1)即可.
(2).s=fun4(4,n1=2)此时也会报错"TypeError: fun4() got multiple values for keyword argument 'n1'",它不能指定n1=2&n2=4,而是n1会赋值多个.
所以,最好还是一一对应的调用函数,平时写程序没有这样去刁难自己,对应即可
总结:文章从系统提供的内部函数、第三方提供函数库+简单爬出代码及安装httplib2模块过程和用户自定函数三个方面进行讲述.文章中如果有错误或不足之处,海涵~最后感谢那个视频老师和上述博主、书籍老师及me.
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持服务器之家!
原文链接:http://blog.csdn.net/eastmount/article/details/39088881