python函数式编程(一)map/reduce、filter、sorted

时间:2021-11-04 20:38:52

1. 变量可以指向函数

函数本身也可以赋值给变量,即:变量可以指向函数:

>>>f = abs

>>>f(-10)

10

2. 传入函数

既然变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。

一个最简单的高阶函数:

defadd(x, y, f):

    return f(x) + f(y)

当我们调用add(-5,6, abs)时,参数x,y和f分别接收-5,6和abs,根据函数定义,我们可以推导计算过程为:

x = -5

y = 6

f = abs

f(x) +f(y) ==> abs(-5) + abs(6) ==> 11

return11

用代码验证一下:

>>>add(-5, 6, abs)

11

编写高阶函数,就是让函数的参数能够接收别的函数。

3. map

我们先看map。map()函数接收两个参数,一个是函数,一个是Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。

有一个函数f(x)=x2,要把这个函数作用在一个list [1, 2, 3, 4, 5, 6, 7, 8, 9]上,就可以用map()实现如下:

>>>def f(x):

         return x * x

>>>r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])

>>>list(r)

[1, 4,9, 16, 25, 36, 49, 64, 81]

map()传入的第一个参数是f,即函数对象本身。由于结果r是一个Iterator,Iterator是惰性序列,因此通过list()函数让它把整个序列都计算出来并返回一个list。

map()作为高阶函数,事实上它把运算规则抽象了,因此,我们不但可以计算简单的f(x)=x2,还可以计算任意复杂的函数,比如,把这个list所有数字转为字符串:

>>>list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))

['1','2', '3', '4', '5', '6', '7', '8', '9']

4. reduce

再看reduce的用法。reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:

reduce(f,[x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)

比方说对一个序列求和,就可以用reduce实现:

>>>from functools import reduce

>>>def add(x, y):

   .    returnx + y

>>>reduce(add, [1, 3, 5, 7, 9])

25

要把序列[1, 3, 5,7, 9]变换成整数13579:

>>>from functools import reduce

>>>def fn(x, y):

       return x * 10 + y

>>>reduce(fn, [1, 3, 5, 7, 9])

13579

5. map、reduce结合使用

可以写出把str转换为int的函数:

fromfunctools import reduce

defstr2int(s):

    def fn(x, y):

        return x * 10 + y

    def char2num(s):

        return {'0': 0, '1': 1, '2': 2, '3': 3,'4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

    return reduce(fn, map(char2num, s))

还可以用lambda函数进一步简化成:

fromfunctools import reduce

defchar2num(s):

    return {'0': 0, '1': 1, '2': 2, '3': 3,'4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

defstr2int(s):

    return reduce(lambda x, y: x * 10 + y,map(char2num, s))

6. map/reduce用例

(1)利用map()函数,把用户输入的不规范的英文名字,变为首字母大写,其他小写的规范名字。输入:['adam', 'LISA', 'barT'],输出:['Adam', 'Lisa','Bart']:

defnormalize(name):

    return name.lower().capitalize()   #str.lower()将所有的字符串变成小写

                                                                   #str.capitalize()返回一个首字母大写的字符串。

L1 =['adam', 'LISA', 'barT']

L2 =list(map(normalize, L1))

print(L2)

(2)python提供的sum()函数可以接受一个list并求和,编写一个prod()函数,可以接受一个list并利用reduce()求积:

fromfunctools import reduce

 

defprod(list):

       def mul(x,y):

              return x*y

       return reduce(mul,list)

print('3* 5 * 7 * 9 =', prod([3, 5, 7, 9]))

(3)利用map和reduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456:

importmath

fromfunctools import reduce

 

defstr2float(s):

       index = s.index('.')        #str.index()得到字符串索引位置,为3(0、1、2、3)

       n = len(s) - 1 - index           #计算小数位数

       s = s.replace('.', '')         #用空取代.,变成'123456'

       def chr2num(s):

              return{'0':0,'1':1,'2':2,'3':3,'4':4,'5':5,'6':6,'7':7,'8':8,'9':9}[s]        

       def cal(x,y):

              return x * 10 + y         

       return reduce(cal, map(chr2num,s))/math.pow(10, n)           

#先将字符串写list[1,2,3,4,5,6];再写作整数123456;对整数除以10的n次方,n为小数位数

print('str2float(\'123.456\')=', str2float('123.456'))

print(type(str2float('123.456')))

7. filter

Python内建的filter()函数用于过滤序列。

和map()类似,filter()也接收一个函数和一个序列。和map()不同的是,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。

在一个list中,删掉偶数,只保留奇数,可以这么写:

defis_odd(n):

    return n % 2 == 1

list(filter(is_odd,[1, 2, 4, 5, 6, 9, 10, 15]))

# 结果: [1, 5, 9, 15]

把一个序列中的空字符串删掉,可以这么写:

defnot_empty(s):

    return s and s.strip()    

    #str.strip()移除字符串头尾指定的字符(默认为空格),此处s字符串若为空,false

list(filter(not_empty,['A', '', 'B', None, 'C', '  ']))

# 结果: ['A', 'B', 'C']

可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。

注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list。

8. 用filter求素数

计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:

首先,列出从2开始的所有自然数,构造一个序列:

2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:

3, 4,5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:

5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一个数5,然后用5把序列的5的倍数筛掉:

7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

不断筛下去,就可以得到所有的素数。

用Python来实现这个算法,可以先构造一个从3开始的奇数序列:

def_odd_iter():

    n = 1

    while True:

        n= n + 2

        yield n

注意这是一个生成器,并且是一个无限序列。

然后定义一个筛选函数:

def_not_divisible(n):

    return lambda x: x % n > 0

最后,定义一个生成器,不断返回下一个素数:

defprimes():

    yield 2

    it = _odd_iter() # 初始序列

    while True:

        n = next(it) # 返回序列的第一个数

        yield n

        it = filter(_not_divisible(n), it) # 构造新序列

这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。

由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:

# 打印1000以内的素数:

for nin primes():

    if n < 1000:

        print(n)

    else:

        break

9. filter用例

回数是指从左向右读和从右向左读都是一样的数,例如12321,909。请利用filter()滤掉非回数:

defis_palindrome(n):

       return str(n)==str(n)[::-1] andlen(str(n))>1      

       #a[::1]将列表a倒序处理,如果a=[1,2,3],则a[::-1]=[3,2,1]

       #字符串'xxx'也可以看成是一种list,每个元素就是一个字符。

      

output=filter(is_palindrome,range(1, 10000))

print(list(output))

10. sorted

Python内置的sorted()函数就可以对list进行排序:

>>>sorted([36, 5, -12, 9, -21])

[-21,-12, 5, 9, 36]

此外,sorted()函数也是一个高阶函数,它还可以接收一个key函数来实现自定义的排序例如按绝对值大小排序:

>>>sorted([36, 5, -12, 9, -21], key=abs)

[5, 9,-12, -21, 36]

key指定的函数将作用于list的每一个元素上,并根据key函数返回的结果进行排序。

我们再看一个字符串排序的例子:

>>>sorted(['bob', 'about', 'Zoo', 'Credit'])

['Credit','Zoo', 'about', 'bob']

默认情况下,对字符串排序,是按照ASCII的大小比较的,由于'Z' < 'a',结果,大写字母Z会排在小写字母a的前面。

现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能用一个key函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较。

这样,我们给sorted传入key函数,即可实现忽略大小写的排序:

>>>sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)

['about','bob', 'Credit', 'Zoo']

要进行反向排序,不必改动key函数,可以传入第三个参数reverse=True

>>>sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)

['Zoo','Credit', 'bob', 'about']

11. sorted用例

(1)假设我们用一组tuple表示学生名字和成绩:

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

用sorted()对上述列表分别按名字排序:

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

defby_name(t):

    return t[:][0]

L2 =sorted(L, key=by_name)

print(L2)

(2)再按成绩从高到低排序:

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

defby_score(t):

    return t[:][1]

L2 =sorted(L, key=by_score, reverse=True)

print(L2)