当前位置:首页 > 文章 > 正文内容

彻底理解闭包实现原理

廖万里3年前 (2022-10-27)文章30353

彻底理解闭包实现原理

前言

闭包对于一个长期写 Java 的开发者来说估计鲜有耳闻,我在写 Python 和 Go 之前也是没怎么了解,光这名字感觉就有点"神秘莫测",这篇文章的主要目的就是从编译器的角度来分析闭包,彻底搞懂闭包的实现原理。

函数一等公民

一门语言在实现闭包之前首先要具有的特性就是:First class function 函数是第一公民。

简单来说就是函数可以像一个普通的值一样在函数中传递,也能对变量赋值。

先来看看在 Go 里是如何编写的:

package mainimport "fmt"var varExternal intfunc f1() func(int) int {
	varInner := 20
	innerFun := func(a int) int {
		fmt.Println(a)
		varExternal++
		varInner++		return varInner
	}	return innerFun
}func main() {
	varExternal = 10
	f2 := f1()	for i := 0; i < 2; i++ {
		fmt.Printf("varInner=%d, varExternal=%d \n", f2(i), varExternal)
	}
	fmt.Println("======")

	f3 := f1()	for i := 0; i < 2; i++ {
		fmt.Printf("varInner=%d, varExternal=%d \n", f3(i), varExternal)
	}
}// Output:0varInner=21, varExternal=11 1varInner=22, varExternal=12 ======0varInner=21, varExternal=13 1varInner=22, varExternal=14

这里体现了闭包的两个重要特性,第一个自然就是函数可以作为值返回,同时也能赋值给变量。

第二个就是在闭包函数 f1() 对闭包变量 varInner 的访问,每个闭包函数的引用都会在自己的函数内部保存一份闭包变量 varInner,这样在调用过程中就不会互相影响。

从打印的结果中也能看出这个特性。

作用域

闭包之所以不太好理解的主要原因是它不太符合自觉。

彻底理解闭包实现原理

本质上就是作用域的关系,当我们调用 f1() 函数的时候,会在栈中分配变量 varInner,正常情况下调用完毕后 f1 的栈会弹出,里面的变量 varInner 自然也会销毁才对。

但在后续的 f2() 和 f3() 调用的时,却依然能访问到 varInner,就这点不符合我们对函数调用的直觉。

但其实换个角度来看,对 innerFun 来说,他能访问到 varExternal 和 varInner 变量,最外层的 varExternal 就不用说了,一定是可以访问的。

但对于 varInner 来说就不一定了,这里得分为两种情况;重点得看该语言是静态/动态作用域。

就静态作用域来说,每个符号在编译器就确定好了树状关系,运行时不会发生变化;也就是说 varInner 对于 innerFun 这个函数来说在编译期已经确定可以访问了,在运行时自然也是可以访问的。

但对于动态作用域来说,完全是在运行时才确定访问的变量是哪一个。

恰好 Go 就是一个静态作用域的语言,所以返回的 innerFun 函数可以一直访问到 varInner 变量。

实现闭包

但 Go 是如何做到在 f1() 函数退出之后依然能访问到 f1() 中的变量呢?

这里我们不妨大胆假设一下:

首先在编译期扫描出哪些是闭包变量,也就是这里的 varInner,需要将他保存到函数 innerFun() 中。

f2 := f1()
f2()

运行时需要判断出 f2 是一个函数,而不是一个变量,同时得知道它所包含的函数体是 innerFun() 所定义的。

接着便是执行函数体的 statement 即可。

而当 f3 := f1() 重新赋值给 f3 时,在 f2 中累加的 varInner 变量将不会影响到 f3,这就得需要在给 f3 赋值的重新赋值一份闭包变量到  f3 中,这样便能达到互不影响的效果。

闭包扫描

GScript 本身也是支持闭包的,所以把 Go 的代码翻译过来便长这样:

int varExternal =10;
func int(int) f1(){	int varInner = 20;	int innerFun(int a){
		println(a);		int c=100;
		varExternal++;
		varInner++;		return varInner;
	}	return innerFun;
}

func int(int) f2 = f1();for(int i=0;i<2;i++){
	println("varInner=" + f2(i) + ", varExternal=" + varExternal);
}
println("=======");
func int(int) f3 = f1();for(int i=0;i<2;i++){
	println("varInner=" + f3(i) + ", varExternal=" + varExternal);
}// Output:0varInner=21, varExternal=111varInner=22, varExternal=12=======0varInner=21, varExternal=131varInner=22, varExternal=14

可以看到运行结果和 Go 的一样,所以我们来看看 GScript 是如何实现的便也能理解 Go 的原理了。


先来看看第一步扫描闭包变量:
彻底理解闭包实现原理

allVariable := c.allVariable(function)
查询所有的变量,包括父 scope 的变量。

scopeVariable := c.currentScopeVariable(function)
查询当前 scope 包含下级所有 scope 中的变量,这样一减之后就能知道闭包变量了,然后将所有的闭包变量存放进闭包函数中。

闭包赋值

彻底理解闭包实现原理
之后在 return innerFun 处,将闭包变量的数据赋值到变量中。

彻底理解闭包实现原理

闭包函数调用

func int(int) f2 = f1();

func int(int) f3 = f1();

在这里每一次赋值时,都会把 f1() 返回函数复制到变量 f2/f3 中,这样两者所包含的闭包变量就不会互相影响。


彻底理解闭包实现原理
在调用函数变量时,判断到该变量是一个函数,则直接返回函数。

之后直接调用该函数即可。

函数式编程

接下来便可以利用 First class function 来试试函数式编程:

class Test{	int value=0;
	Test(int v){
		value=v;
	}	int map(func int(int) f){		return f(value);
	}
}int square(int v){	return v*v; 
}int add(int v){	return v++; 
}int add2(int v){
	v=v+2;	return v; 
}Test t =Test(100);
func int(int) s= square;
func int(int) a= add;
func int(int) a2= add2;
println(t.map(s));
assertEqual(t.map(s),10000);

println(t.map(a));
assertEqual(t.map(a),101);

println(t.map(a2));
assertEqual(t.map(a2),102);

这个有点类似于 Java 中流的 map 函数,将函数作为值传递进去,后续支持匿名函数后会更像是函数式编程,现在必须得先定义一个函数变量再进行传递。


除此之外在 GScript 中的 http 标准库也利用了函数是一等公民的特性:

// 标准库:Bind routehttpHandle(string method, string path, func (HttpContext) handle){    HttpContext ctx = HttpContext();
    handle(ctx);
}

在绑定路由时,handle 便是一个函数,使用的时候直接传递业务逻辑的 handle 即可:

func (HttpContext) handle (HttpContext ctx){    Person p = Person();
    p.name = "abc";
    println("p.name=" + p.name);
    println("ctx=" + ctx);
    ctx.JSON(200, p);
}
httpHandle("get", "/p", handle);

总结

总的来说闭包具有以下特性:

  • 函数需要作为一等公民。

  • 编译期扫描出所有的闭包变量。

  • 在返回闭包函数时,为闭包变量赋值。

  • 每次创建新的函数变量时,需要将闭包数据复制进去,这样闭包变量才不会互相影响。

  • 调用函数变量时,需要判断为函数,而不是变量。

彻底理解闭包实现原理
可以在 Playground 中体验闭包函数打印裴波那切数列的运用。


本文链接:https://www.kkkliao.cn/?id=152 转载需授权!

分享到:

版权声明:本文由廖万里的博客发布,如需转载请注明出处。


“彻底理解闭包实现原理” 的相关文章

日本拆无人机后曝光:核心芯片来自美国,大疆会走上华为的老路吗?

日本拆无人机后曝光:核心芯片来自美国,大疆会走上华为的老路吗?

大疆无人机在日被拆解,确认核心部件源自美国?在无人机领域盛传一句话:“世界无人机只分为两类,大疆和其他‘玩具机’”。因此,作为入选了胡润全球独角兽企业的大疆无人机公司,一直是美国、日本等多个国家高精尖企业眼中的“香饽饽”。他们试图攻克大疆的操作原理,更致力于找到突破中国无人机第一的弱点。2020年大...

开始“反扑”了?中国院士正式宣布,厉害的不只有华为

开始“反扑”了?中国院士正式宣布,厉害的不只有华为

随着中国的这些年的不断发展,中国在各方都取得了很大的成就,现在的中国已经发生了翻天覆地的变化。在生活上。我们进入了电商时代,进入了移动支付时代;在科技上,我们进入了智能互联网时代,即将迎来的是全新的5G时代,还有很多很多中国制造都是值得我们骄傲的。特别值得提及的就是,现在中国制造已经成为了我们的一个...

失窃iPhone最终归宿:一台被盗的手机,如何在华强北“焕发新生”

失窃iPhone最终归宿:一台被盗的手机,如何在华强北“焕发新生”

华强北,一个中国数码史上现象级的名词。这条中轴主干道南北长900多米的街区,造就了中国电子科技历史上的神话。但一个硬币有两面,如果说腾讯、TP-Link这样的成功企业代表了华强北向阳的一面,那么华强北的阴暗一面,就离不开两个词:组装机和山寨机。如今,在各大手机厂商物美价廉的新品联合绞杀之下,山寨机已...

微信一定要关闭的6个设置

微信一定要关闭的6个设置

微信里面的个人隐私信息必须要注意,尤其是微信里面设置里面的一些功能,都应该要及时关闭,以免自己就的个人隐私遭到暴露。1,自动扣费/免密支付项目点击我→服务→点击钱包→选择支付设置→关闭自动续费、免密支付,这两项不需要的。2,关闭自动下载点击我→设置→点击通用→选择照片/视频→关闭自动下载。如果不关闭...

六零后已经渐渐老了,都是独生子女家庭,以后怎样养老?

六零后已经渐渐老了,都是独生子女家庭,以后怎样养老?

我是68年的,今年54岁,我也只有一个女儿,以后怎么养老的问题,我在十年前就开始准备了,所以我的养老问题我现在一点都不担心,因为我早已经准备好了。我从上班到退休一直在银行储蓄柜工作。工作小柜台,人生大舞台,在几十年的工作中我见识了形形色色的人,也见过很多老人特别是没有退休金的老人晚年凄苦的生活。所以...

专访中凝科技90后董事长王天赋:7年打造气凝胶“小巨人”,未来3年冲刺上市

专访中凝科技90后董事长王天赋:7年打造气凝胶“小巨人”,未来3年冲刺上市

本文来源:时代周报 作者:黄嘉祥气凝胶是世界上密度最小的固体,被誉为可以改变世界的多功能新材料,这条超百亿级别的新赛道正在崛起,入局者越来越多。90后“创二代”王天赋正是气凝胶赛道的创业者之一,他在2015年创办了深圳中凝科技有限公司(下称“中凝科技”),带领团队研制气凝胶,在全球首创气凝胶无氯常压...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。