在Scala中,函数引入传入的参数是再正常不过的事情了,比如 (x: Int) => x > 0
中,唯一在函数体x > 0
中用到的变量是x,即这个函数的唯一参数。
除此之外,Scala还支持引用其他地方定义的变量: (x: Int) => x + more
,这个函数将more
也作为入参,不过这个参数是哪里来的?从这个函数的角度来看,more是一个自由变量,因为函数字面量本身并没有给more赋予任何含义。相反,x是一个绑定变量,因为它在该函数的上下文里有明确的定义:它被定义为该函数的唯一参数。如果单独使用这个函数字面量,而没有在任何处于作用域内的地方定义more,编译器将报错:
scala> (x: Int) => x + more:12: error: not found: value more (x: Int) => x + more复制代码
另一方面,只要能找到名为more的变量,同样的函数字面量就能正常工作:
scala> var more = 1more: Int = 1scala> val addMore = (x: Int) => x + moreaddMore: Int => Int = $$Lambda$1104/583744857@33e4b9c4scala> addMore(10)res0: Int = 11复制代码
运行时从这个函数字面量创建出来的函数值(对象)被称为闭包。该名称源于“捕获”其自由变量从而“闭合”该函数字面量的动作。没有自由变量的函数字面量,比如(x: Int) => x + 1
,称为闭合语(这里的语指的是一段源代码)。因此,运行时从这个函数字面量创建出来的函数值严格来说并不是一个闭包,因为(x: Int) => x + 1
按照目前这个写法已经是闭合的了。而运行时从任何带有自由变量的函数字面量,比如(x: Int) => x + more
创建的函数,按照定义,要求捕获到它的自由变量more的绑定。相应的函数值结果(包含指向被捕获的more变量的引用)就被称为闭包,因为函数值是通过闭合这个开放语的动作产生的。
这个例子带来一个问题:如果more在闭包创建以后被改变会发生什么?在Scala中,答案是闭包能够看到这个改变,参考下面的例子:
scala> more = 9999more: Int = 9999scala> addMore(10)res1: Int = 10009复制代码
很符合直觉的是,Scala的闭包捕获的是变量本身,而不是变量引用的值。正如前面示例所展示的,为(x: Int) => x + more
创建的闭包能够看到闭包外对more的修改。反过来也是成立的:闭包对捕获到的变量的修改也能在闭包外被看到。参考下面的例子:
scala> val someNumbers = List(-11, -10, -5, 0, 5, 10)someNumbers: List[Int] = List(-11, -10, -5, 0, 5, 10)scala> var sum = 0sum: Int = 0scala> someNumbers.foreach(sum += _)scala> sumres3: Int = -11复制代码
这个例子通过遍历的方式来对List中的数字求和。sum这个变量位于函数字面量sum += _
的外围作用域,这个函数将数字加给sum。虽然运行时是这个闭包对sum进行的修改,最终的结果-11仍然能被闭包外部看到。
那么,如果一个闭包访问了某个随着程序运行会产生多个副本的变量会如何呢?例如,如果一个闭包使用了某个函数的局部变量,而这个函数又被调用了多次,会怎么样?闭包每次访问到的是这个变量的哪一个实例呢?
答案是:闭包引用的实例是在闭包被创建时活跃的那一个。参考下面的函数,函数创建并返回more闭包的函数
def makeIncreaser(more: Int) = (x: Int) => x + more复制代码
该函数每调用一次,就会创建一个新的闭包。每个闭包都会访问那个在它创建时活跃的变量more
scala> val inc1 = makeIncreaser(1)inc1: Int => Int = $$Lambda$1269/1504482477@1179731cscala> val inc9999 = makeIncreaser(9999)inc9999: Int => Int = $$Lambda$1269/1504482477@2dba6013复制代码
当调用makeIncreaser(1)
时,一个捕获了more的绑定值为1的闭包就被创建并返回。同理,当调用makeIncreaser(9999)
时,返回的是一个捕获了more的绑定值9999的闭包。当你将这些闭包应用到入参时,其返回结果取决于闭包创建时more的定义
scala> inc1(10)res4: Int = 11scala> inc9999(10)res5: Int = 10009复制代码
这里,more是某次方法调用的入参,而方法已经返回了,不过这并没有影响。Scala编译器会重新组织和安排,让被捕获的参数在堆上继续存活。这样的安排都是由编译器自动完成的,使用者并不需要关心。