package com.dtspark.scala.basics /** * 函数式编程进阶: * 1,函数和变量一样作为Scala语言的一等公民,函数可以直接赋值给变量; * 2, 函数更长用的方式是匿名函数,定义的时候只需要说明输入参数的类型和函数体即可,不需要名称,但是如果你要使用的话,一般会把这个匿名函数赋值给一个变量(其实是val常量),Spark源码中大量存在这种语法,必须掌握; * 3, 函数可以作为参数直接传递给函数,这极大的简化的编程的语法,为什么这样说呢?原因非常简单: * 第一:以前Java的方式是new出一个接口实例,并且在接口实例的回调方法callback中来实现业务逻辑,现在是直接把回调方法callback传递给我的函数,且在函数体中直接使用,这毫无疑问的简化的代码的编写,提升了开发效率; * 第二:这种方式非常方便编写复杂的业务逻辑和控制逻辑,对于图计算、机器学习、深度学习等而言至关重要; * * 函数作为函数的参数传递的编程方式是称之为高阶函数的编程方式,Spark源码和应用程序开发中至少60%都是这种代码,必须务必一定要掌握。 * 4, 函数式编程一个非常强大的地方之一在于函数的返回值可以是函数,当函数的返回类型是函数的时候,这个时候就表明Scala的函数实现了闭包! * Scala闭包的内幕是:Scala的函数背后是类和对象,所以,Scala的参数都作为了对象的成员!!!!!!,所以后续可以继续访问,这就是Scala实现闭包的原理内幕! * * 5, Currying, 复杂的函数式编程中经常使用,可以维护变量在内存中的状态,且实现返回函数的链式功能,可以实现非常复杂的算法和逻辑; */ object functionalProgramming { def main(args: Array[String]): Unit = { /** * 1,函数和变量一样作为Scala语言的一等公民,函数可以直接赋值给变量; */ val hiData = hiBigData _ hiData("Spark") /** * 2, 函数更长用的方式是匿名函数,定义的时候只需要说明输入参数的类型和函数体即可,不需要名称,但是如果你要使用的话,一般会把这个 * 匿名函数赋值给一个变量(其实是val常量),Spark源码中大量存在这种语法,必须掌握; */ val f = (name: String) => println("Hi, " + name) f("Kafka") /** * * 3, 函数可以作为参数直接传递给函数,这极大的简化的编程的语法,为什么这样说呢?原因非常简单: * 第一:以前Java的方式是new出一个接口实例,并且在接口实例的回调方法callback中来实现业务逻辑,现在是直接把回调方法callback传递给我的函数,且在函数体中直接使用,这毫无疑问的简化的代码的编写,提升了开发效率; * 第二:这种方式非常方便编写负责的业务逻辑和控制逻辑,对于图计算、机器学习、深度学习等而言至关重要; * 函数作为函数的参数传递的编程方式是称之为高阶函数的编程方式,Spark源码和应用程序开发中至少60%都是这种代码,必须务必一定要掌握。 */ def getName(func: (String) => Unit, name: String){ func(name) } getName(f,"Scala") Array(1 to 10: _*).map { (item: Int) => 2 * item }.foreach { x => println(x) } /** * 4, 函数式编程一个非常强大的地方之一在于函数的返回值可以是函数,当函数的返回类型是函数的时候,这个时候就表明Scala的函数实现了闭包! * Scala闭包的内幕是:Scala的函数背后是类和对象,所以,Scala的参数都作为了对象的成员!!!!!!,所以后续可以继续访问,这就是Scala * 实现闭包的原理内幕! */ def funcResult(message: String) = (name: String) => println(message + " : " + name) //def funcResult(message: String, name: String){println(message + " : " + name)} funcResult("Hello")("Java") //Currying函数写法, 必须掌握这种写法,只要是复杂的Scala函数式编程代码就一定会使用这种写法 val result = funcResult("Hello") result("Java") } def hiBigData(name: String){ println("Hi, " + name) } }
2.补充知识
a.代码中第一点有一句
val hiData = hiBigData _ 这里_将hiBigData 转成了函数
在Scala中,无法直接操纵方法,只能直接操纵函数,所以需要使用_。
b.代码中第二和第三点
val f = (name: String) => println(“Hi, ” + name) 调用时直接f(“Kafka”)容易理解。
但是 getName(f,”Scala”) 调用时这里f 是没参数的!
def getName(func: (String) => Unit, name: String){
func(name)
}
这里getName第一个参数是函数,输入类型为String,无返回值。所以这里第一个参数是函数,而开始学的时候,我一直不理解为什么没有括号,像这样 getName(f(“xx”),”Scala”),仔细想过之后才知道f(“xx”)不是函数,而是一个Unit,而要求的是(String)=>Unit!也就是说函数作为参数传入时是不能加括号的!!!
函数中如果函数作为参数传入,有两种调用方式,第一种是上面那种,先定义一个函数值,如
val f = (name: String) => println(“Hi, ” + name) ,这里也可用def f(name: String){println(“Hi, ” + name)},然后传入名称就行。第二种是直接写入匿名函数,如这里也可以改为 getName((name: String) => println(“Hello, ” + name) , “Spark”)
个人感觉难点还是在传入函数与函数之间的如何使用才是难点!
c.闭包
什么是闭包? funcResult(“Hello”)(“Java”)中”Hello”是第一个参数,”Java”是第二个参数,正常情况下一个函数参数是不会保存下来的,因为这里是没有创建对象,如果要保存下来得这样吧:val some = “Hello”,定义个内存空间给他,然后funcResult(some)这样。但是例子中是保存下来了,保存在哪里?可以理解为像funcResult这种函数作为函数返回值的类型里面有一个小地方用为保存参数的,而这个函数看作两个函数,一旦程序运行时第一个函数会先得到一个参数,然后会保存起来,后面的第二个函数能拿到这个参数来继续使用(越说越不清了 -_-!)。