python函数式编程（一）map/reduce、filter、sorted

1. 变量可以指向函数

函数本身也可以赋值给变量，即：变量可以指向函数：

>>>f = abs

>>>f(-10)

2. 传入函数

既然变量可以指向函数，函数的参数能接收变量，那么一个函数就可以接收另一个函数作为参数，这种函数就称之为高阶函数。

一个最简单的高阶函数：

defadd(x, y, f):

return f(x) + f(y)

当我们调用add(-5,6, abs)时，参数x，y和f分别接收-5，6和abs，根据函数定义，我们可以推导计算过程为：

x = -5

y = 6

f = abs

f(x) +f(y) ==> abs(-5) + abs(6) ==> 11

return11

用代码验证一下：

>>>add(-5, 6, abs)

编写高阶函数，就是让函数的参数能够接收别的函数。

3. map

我们先看map。map()函数接收两个参数，一个是函数，一个是Iterable，map将传入的函数依次作用到序列的每个元素，并把结果作为新的Iterator返回。

有一个函数f(x)=x2，要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]上，就可以用map()实现如下：

>>>def f(x):

return x * x

>>>r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])

>>>list(r)

[1, 4,9, 16, 25, 36, 49, 64, 81]

map()传入的第一个参数是f，即函数对象本身。由于结果r是一个Iterator，Iterator是惰性序列，因此通过list()函数让它把整个序列都计算出来并返回一个list。

map()作为高阶函数，事实上它把运算规则抽象了，因此，我们不但可以计算简单的f(x)=x2，还可以计算任意复杂的函数，比如，把这个list所有数字转为字符串：

>>>list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))

['1','2', '3', '4', '5', '6', '7', '8', '9']

4. reduce

再看reduce的用法。reduce把一个函数作用在一个序列[x1, x2, x3, ...]上，这个函数必须接收两个参数，reduce把结果继续和序列的下一个元素做累积计算，其效果就是：

reduce(f,[x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)

比方说对一个序列求和，就可以用reduce实现：

>>>from functools import reduce

>>>def add(x, y):

. returnx + y

>>>reduce(add, [1, 3, 5, 7, 9])

要把序列[1, 3, 5,7, 9]变换成整数13579:

>>>from functools import reduce

>>>def fn(x, y):

return x * 10 + y

>>>reduce(fn, [1, 3, 5, 7, 9])

13579

5. map、reduce结合使用

可以写出把str转换为int的函数：

fromfunctools import reduce

defstr2int(s):

def fn(x, y):

return x * 10 + y

def char2num(s):

return {'0': 0, '1': 1, '2': 2, '3': 3,'4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

return reduce(fn, map(char2num, s))

还可以用lambda函数进一步简化成：

fromfunctools import reduce

defchar2num(s):

return {'0': 0, '1': 1, '2': 2, '3': 3,'4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

defstr2int(s):

return reduce(lambda x, y: x * 10 + y,map(char2num, s))

6. map/reduce用例

(1)利用map()函数，把用户输入的不规范的英文名字，变为首字母大写，其他小写的规范名字。输入：['adam', 'LISA', 'barT']，输出：['Adam', 'Lisa','Bart']：

defnormalize(name):

return name.lower().capitalize() #str.lower()将所有的字符串变成小写

#str.capitalize()返回一个首字母大写的字符串。

L1 =['adam', 'LISA', 'barT']

L2 =list(map(normalize, L1))

print(L2)

(2)python提供的sum()函数可以接受一个list并求和，编写一个prod()函数，可以接受一个list并利用reduce()求积：

fromfunctools import reduce

defprod(list):

def mul(x,y):

return x*y

return reduce(mul,list)

print('3* 5 * 7 * 9 =', prod([3, 5, 7, 9]))

(3)利用map和reduce编写一个str2float函数，把字符串'123.456'转换成浮点数123.456：

importmath

fromfunctools import reduce

defstr2float(s):

index = s.index('.') #str.index()得到字符串索引位置,为3(0、1、2、3)

n = len(s) - 1 - index #计算小数位数

s = s.replace('.', '') #用空取代.,变成'123456'

def chr2num(s):

return{'0':0,'1':1,'2':2,'3':3,'4':4,'5':5,'6':6,'7':7,'8':8,'9':9}[s]

def cal(x,y):

return x * 10 + y

return reduce(cal, map(chr2num,s))/math.pow(10, n)

#先将字符串写list[1,2,3,4,5,6];再写作整数123456;对整数除以10的n次方，n为小数位数

print('str2float(\'123.456\')=', str2float('123.456'))

print(type(str2float('123.456')))

7. filter

Python内建的filter()函数用于过滤序列。

和map()类似，filter()也接收一个函数和一个序列。和map()不同的是，filter()把传入的函数依次作用于每个元素，然后根据返回值是True还是False决定保留还是丢弃该元素。

在一个list中，删掉偶数，只保留奇数，可以这么写：

defis_odd(n):

return n % 2 == 1

list(filter(is_odd,[1, 2, 4, 5, 6, 9, 10, 15]))

# 结果: [1, 5, 9, 15]

把一个序列中的空字符串删掉，可以这么写：

defnot_empty(s):

return s and s.strip()

#str.strip()移除字符串头尾指定的字符（默认为空格），此处s字符串若为空，false

list(filter(not_empty,['A', '', 'B', None, 'C', ' ']))

# 结果: ['A', 'B', 'C']

可见用filter()这个高阶函数，关键在于正确实现一个“筛选”函数。

注意到filter()函数返回的是一个Iterator，也就是一个惰性序列，所以要强迫filter()完成计算结果，需要用list()函数获得所有结果并返回list。

8. 用filter求素数

计算素数的一个方法是埃氏筛法，它的算法理解起来非常简单：

首先，列出从2开始的所有自然数，构造一个序列：

2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取序列的第一个数2，它一定是素数，然后用2把序列的2的倍数筛掉：

3, 4,5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一个数3，它一定是素数，然后用3把序列的3的倍数筛掉：

5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一个数5，然后用5把序列的5的倍数筛掉：

7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

不断筛下去，就可以得到所有的素数。

用Python来实现这个算法，可以先构造一个从3开始的奇数序列：

def_odd_iter():

n = 1

while True:

n= n + 2

yield n

注意这是一个生成器，并且是一个无限序列。

然后定义一个筛选函数：

def_not_divisible(n):

return lambda x: x % n > 0

最后，定义一个生成器，不断返回下一个素数：

defprimes():

yield 2

it = _odd_iter() # 初始序列

while True:

n = next(it) # 返回序列的第一个数

yield n

it = filter(_not_divisible(n), it) # 构造新序列

这个生成器先返回第一个素数2，然后，利用filter()不断产生筛选后的新的序列。

由于primes()也是一个无限序列，所以调用时需要设置一个退出循环的条件：

# 打印1000以内的素数:

for nin primes():

if n < 1000:

print(n)

else:

break

9. filter用例

回数是指从左向右读和从右向左读都是一样的数，例如12321，909。请利用filter()滤掉非回数：

defis_palindrome(n):

return str(n)==str(n)[::-1] andlen(str(n))>1

#a[::1]将列表a倒序处理，如果a＝[1,2,3]，则a[::－1]=[3，2，1]

#字符串'xxx'也可以看成是一种list，每个元素就是一个字符。

output=filter(is_palindrome,range(1, 10000))

print(list(output))

10. sorted

Python内置的sorted()函数就可以对list进行排序：

>>>sorted([36, 5, -12, 9, -21])

[-21,-12, 5, 9, 36]

此外，sorted()函数也是一个高阶函数，它还可以接收一个key函数来实现自定义的排序例如按绝对值大小排序：

>>>sorted([36, 5, -12, 9, -21], key=abs)

[5, 9,-12, -21, 36]

key指定的函数将作用于list的每一个元素上，并根据key函数返回的结果进行排序。

我们再看一个字符串排序的例子：

>>>sorted(['bob', 'about', 'Zoo', 'Credit'])

['Credit','Zoo', 'about', 'bob']

默认情况下，对字符串排序，是按照ASCII的大小比较的，由于'Z' < 'a'，结果，大写字母Z会排在小写字母a的前面。

现在，我们提出排序应该忽略大小写，按照字母序排序。要实现这个算法，不必对现有代码大加改动，只要我们能用一个key函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串，实际上就是先把字符串都变成大写（或者都变成小写），再比较。

这样，我们给sorted传入key函数，即可实现忽略大小写的排序：

>>>sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)

['about','bob', 'Credit', 'Zoo']

要进行反向排序，不必改动key函数，可以传入第三个参数reverse=True

>>>sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)

['Zoo','Credit', 'bob', 'about']

11. sorted用例

(1)假设我们用一组tuple表示学生名字和成绩：

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

用sorted()对上述列表分别按名字排序：

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

defby_name(t):

return t[:][0]

L2 =sorted(L, key=by_name)

print(L2)

(2)再按成绩从高到低排序：

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

defby_score(t):

return t[:][1]

L2 =sorted(L, key=by_score, reverse=True)

print(L2)

秒客网

python函数式编程（一）map/reduce、filter、sorted

相关文章