diva-notes
  • README
  • Ads
    • 定价策略
    • 广告层级
    • 归因模型
    • 买量
    • Chat GPT
    • Google
  • AI
    • 参考资料
    • Chat GPT
    • stable-diffusion-webui安装
  • Algorithm
    • 倍增
    • 并查集
    • 参考
    • 环的判断
    • 凸包
    • 蓄水池抽样
    • 最短路径
    • 最小生成树
    • KMP算法
    • Rabin-Karp算法
    • Tarjan桥算法
  • Architecture
    • Serverless
  • Career
  • CICD
    • 代码质量
    • CICD实践
  • Data Structure
    • 布谷鸟过滤器
    • 布隆过滤器
    • 浮点
    • 红黑树
    • 锁
    • LSM树
  • DB
    • My SQL
      • 隔离级别
      • 架构
      • 索引
      • 锁
      • 页结构
      • 主从同步
      • ACID
      • Log
      • MVCC
      • Questions
    • Postgres
      • 持久化
      • 对比MySQL
      • 隔离级别
      • 索引
      • Greenpulm
      • MVCC
    • 倒排索引
    • 列式存储
    • H Base
    • HDFS
    • MPP数据库选型
    • Questions
  • Distributed System
    • 分布式事务
    • 服务网格
    • BASE理论
    • CAP
    • Etcd
    • Raft协议
    • ZAB协议
  • Go
    • 1.语言基础
      • 1.CPU寄存器
      • 2-1.函数调用
      • 2-2.函数调用栈
      • 2.接口
      • 3.汇编
      • 4.调试
    • 2.编译
      • 1.编译
      • 2.词法与语法分析
      • 3.类型检查
      • 4.中间代码生成
      • 5.机器码生成
    • 3.数据结构
      • 1.数组array
      • 2.切片slice
      • 3.哈希表map
      • 4.字符串
    • 4.常用关键字
      • 1.循环
      • 2.defer
      • 3.panic和recover
      • 4.make和new
    • 5.并发编程
      • 1.上下文Context的实现
      • 2-1.runtime.sema信号量
      • 2-2.sync.Mutex的实现
      • 2-3.sync.WaitGroup
      • 2-4.sync.Once的实现
      • 2-5.sync.Map的实现
      • 2-6.sync.Cond
      • 2-7.sync.Pool的实现
      • 2-8.sync.Semaphore的实现
      • 2-9.sync.ErrGroup
      • 3.定时器Timer的实现
      • 4.Channel的实现
      • 5-1.调度-线程
      • 5-2.调度-MPG
      • 5-3.调度-程序及调度启动
      • 5-4.调度-调度策略
      • 5-5.调度-抢占
      • 6.netpoll实现
      • 7.atomic
    • 6.内存管理
      • 1-1.内存分配基础-TCmalloc
      • 1-2.内存分配
      • 2.垃圾回收
      • 3.栈内存管理
    • 参考
    • 各版本特性
    • 坑
    • Go程序性能优化
    • http.Client
    • net.http路由
    • profile采样的实现
    • Questions
    • time的设计
  • Kafka
    • 高可用
    • 架构
    • 消息队列选型
    • ISR
    • Questions
  • Network
    • ARP
    • DNS
    • DPVS
    • GET和POST
    • HTTP 2
    • HTTP 3
    • HTTPS
    • LVS的转发模式
    • NAT
    • Nginx
    • OSI七层模型
    • Protobuf
    • Questions
    • REST Ful
    • RPC
    • socket缓冲区
    • socket详解
    • TCP滑动窗口
    • TCP连接建立源码
    • TCP连接四元组
    • TCP三次握手
    • TCP数据结构
    • TCP四次挥手
    • TCP拥塞控制
    • TCP重传机制
    • UDP
  • OS
    • 磁盘IO
    • 调度
    • 进程VS线程
    • 零拷贝
    • 内存-虚拟内存
    • 内存分配
    • 用户态VS内核态
    • 中断
    • COW写时复制
    • IO多路复用
    • Questions
  • Redis
    • 安装
    • 参考
    • 高可用-持久化
    • 高可用-主从同步
    • 高可用-Cluster
    • 高可用-Sentinel
    • 缓存一致性
    • 事务
    • 数据结构-SDS
    • 数据结构-Skiplist
    • 数据结构-Ziplist
    • 数据结构
    • 数据类型-Hashtable
    • 数据类型-List
    • 数据类型-Set
    • 数据类型-Zset
    • 数据淘汰机制
    • 通信协议-RESP
    • Questions
    • Redis6.0多线程
    • Redis分布式锁
    • Redis分片
  • System Design
    • 本地缓存
    • 错误处理
    • 大文件处理
    • 点赞收藏关注
    • 短链接生成系统
    • 负载均衡
    • 高并发高可用
    • 规则引擎
    • 集卡活动
    • 秒杀系统
    • 评论系统
    • 熔断
    • 限流
    • 延迟队列
    • Docker
    • ES
    • K 8 S
    • Node.js
    • Questions
  • Work
    • Bash
    • Charles
    • Code Review
    • Ffmpeg
    • Git
    • intellij插件
    • I Term 2
    • Mac
    • mysql命令
    • Nginx
    • postgresql命令
    • Protoc
    • Ssh
    • Systemd
    • Tcp相关命令
    • Vim
Powered by GitBook
On this page
  • 2.3.1 强弱类型
  • 2.3.2 静态类型与动态类型
  • 静态类型检查
  • 动态类型检查
  • 小结
  • 2.3.3 执行过程
  • 切片 OTARRAY
  • 哈希 OTMAP
  • 关键字 OMAKE
  • 2.3.4 小结
  • 原文链接
  1. Go
  2. 2.编译

3.类型检查

Previous2.词法与语法分析Next4.中间代码生成

Last updated 2 years ago

2.3.1 强弱类型

1经常会被放在一起讨论,然而这两者并没有一个学术上的严格定义,多查阅些资料理解起来反而更加困难,很多资料甚至相互矛盾。

由于权威的定义的缺失,对于强弱类型,我们很多时候也只能根据现象和特性从直觉上进行判断,一般会有如下结论2:

  • 强类型的编程语言在编译期间会有更严格的类型限制,也就是编译器会在编译期间发现变量赋值、返回值和函数调用时的类型错误;

  • 弱类型的编程语言在出现类型错误时可能会在运行时进行隐式的类型转换,在类型转换时可能会造成运行错误。

依据上面的结论,我们就可以认为 Java、C# 等在编译期间进行类型检查的编程语言是强类型的。同样地,因为 Go 语言会在编译期间发现类型错误,也应该是强类型的编程语言。

如果强类型与弱类型这一对概念定义不严格且有歧义,那么在概念上较真本身是没有太多太多实际价值的,起码对于我们真正使用和理解编程语言帮助不大。问题来了,作为一种抽象的定义,我们使用它是为了什么呢?答案是,更多时候是为了方便沟通和分类。让我们忽略强弱类型,把更多注意力放到下面的问题上:

  • 类型的转换是显式的还是隐式的?

  • 编译器会帮助我们推断变量的类型么?

这些具体的问题在这种语境下其实更有价值,也希望各位读者能够减少对强弱类型的争执。

2.3.2 静态类型与动态类型

静态类型和动态类型的编程语言其实也是两个不精确的表述,正确的表达应该是使用和的编程语言,这一小节会分别介绍两种类型检查的特点以及它们的区别。

静态类型检查

静态类型检查是基于对源代码的分析来确定运行程序类型安全的过程3,如果我们的代码能够通过静态类型检查,那么当前程序在一定程度上可以满足类型安全的要求,它能够减少程序在运行时的类型检查,也可以被看作是一种代码优化的方式。

作为一个开发者来说,静态类型检查能够帮助我们在编译期间发现程序中出现的类型错误,一些动态类型的编程语言都会有社区提供的工具为这些编程语言加入静态类型检查,例如 JavaScript 的 4,这些工具能够在编译期间发现代码中的类型错误。

相信很多读者也都听过『动态类型一时爽,代码重构火葬场』5,使用 Python、Ruby 等编程语言的开发者一定对这句话深有体会,静态类型为代码在编译期间提供了约束,编译器能够在编译期间约束变量的类型。

静态类型检查在重构时能够帮助我们节省大量时间并避免遗漏,但是如果编程语言仅支持动态类型检查,那么就需要写大量的单元测试保证重构不会出现类型错误。当然这里并不是说测试不重要,我们写的任何代码都应该有良好的测试,这与语言没有太多的关系。

动态类型检查

动态类型检查是在运行时确定程序类型安全的过程,它需要编程语言在编译时为所有的对象加入类型标签等信息,运行时可以使用这些存储的类型信息来实现动态派发、向下转型、反射以及其他特性6。动态类型检查能为工程师提供更多的操作空间,让我们能在运行时获取一些类型相关的上下文并根据对象的类型完成一些动态操作。

只使用动态类型检查的编程语言叫做动态类型编程语言,常见的动态类型编程语言就包括 JavaScript、Ruby 和 PHP,虽然这些编程语言在使用上非常灵活也不需要经过编译,但是有问题的代码该不会因为更加灵活就会减少错误,该出错时仍然会出错,它们在提高灵活性的同时,也提高了对工程师的要求。

小结

静态类型检查和动态类型检查不是完全冲突和对立的,很多编程语言都会同时使用两种类型检查,例如:Java 不仅在编译期间提前检查类型发现类型错误,还为对象添加了类型信息,在运行时使用反射根据对象的类型动态地执行方法增强灵活性并减少冗余代码。

2.3.3 执行过程

Go 语言的编译器不仅使用静态类型检查来保证程序运行的类型安全,还会在编程期间引入类型信息,让工程师能够使用反射来判断参数和变量的类型。当我们想要将 interface{} 转换成具体类型时会进行动态类型检查,如果无法发生转换就会发生程序崩溃。

	for i := 0; i < len(xtop); i++ {
		n := xtop[i]
		if op := n.Op; op != ODCL && op != OAS && op != OAS2 && (op != ODCLTYPE || !n.Left.Name.Param.Alias) {
			xtop[i] = typecheck(n, ctxStmt)
		}
	}

	for i := 0; i < len(xtop); i++ {
		n := xtop[i]
		if op := n.Op; op == ODCL || op == OAS || op == OAS2 || op == ODCLTYPE && n.Left.Name.Param.Alias {
			xtop[i] = typecheck(n, ctxStmt)
		}
	}

	...

	checkMapKeys()
func typecheck1(n *Node, top int) (res *Node) {
	switch n.Op {
	case OTARRAY:
		...

	case OTMAP:
		...

	case OTCHAN:
		...
	}

	...

	return n
}

切片 OTARRAY

如果当前节点的操作类型是 OTARRAY,那么这个分支首先会对右节点,也就是切片或者数组中元素的类型进行类型检查:

	case OTARRAY:
		r := typecheck(n.Right, Etype)
		if r.Type == nil {
			n.Type = nil
			return n
		}
		if n.Left == nil {
			t = types.NewSlice(r.Type)
func typecheckcomplit(n *Node) (res *Node) {
	...
	if n.Right.Op == OTARRAY && n.Right.Left != nil && n.Right.Left.Op == ODDD {
		n.Right.Right = typecheck(n.Right.Right, ctxType)
		if n.Right.Right.Type == nil {
			n.Type = nil
			return n
		}
		elemType := n.Right.Right.Type

		length := typecheckarraylit(elemType, -1, n.List.Slice(), "array literal")

		n.Op = OARRAYLIT
		n.Type = types.NewArray(elemType, length)
		n.Right = nil
		return n
	}
	...
}
		} else {
			n.Left = indexlit(typecheck(n.Left, ctxExpr))
			l := n.Left
			v := l.Val()
			bound := v.U.(*Mpint).Int64()
			t = types.NewArray(r.Type, bound)		}

		n.Op = OTYPE
		n.Type = t
		n.Left = nil
		n.Right = nil

哈希 OTMAP

如果处理的节点是哈希,那么编译器会分别检查哈希的键值类型以验证它们类型的合法性:

	case OTMAP:
		n.Left = typecheck(n.Left, Etype)
		n.Right = typecheck(n.Right, Etype)
		l := n.Left
		r := n.Right
		n.Op = OTYPE
		n.Type = types.NewMap(l.Type, r.Type)
		mapqueue = append(mapqueue, n)
		n.Left = nil
		n.Right = nil
func NewMap(k, v *Type) *Type {
	t := New(TMAP)
	mt := t.MapType()
	mt.Key = k
	mt.Elem = v
	return t
}
func checkMapKeys() {
	for _, n := range mapqueue {
		k := n.Type.MapType().Key
		if !k.Broke() && !IsComparable(k) {
			yyerrorl(n.Pos, "invalid map key type %v", k)
		}
	}
	mapqueue = nil
}

该函数会遍历 mapqueue 队列中等待检查的节点,判断这些类型能否作为哈希的键,如果当前类型不合法会在类型检查的阶段直接报错中止整个检查的过程。

关键字 OMAKE

图 2-4 类型检查阶段对 make 进行改写

编译器会先检查关键字 make 的第一个类型参数,根据类型的不同进入不同分支,切片分支 TSLICE、哈希分支 TMAP 和 Channel 分支 TCHAN:

	case OMAKE:
		args := n.List.Slice()

		n.List.Set(nil)
		l := args[0]
		l = typecheck(l, Etype)
		t := l.Type

		i := 1
		switch t.Etype {
		case TSLICE:
			...

		case TMAP:
			...

		case TCHAN:
			...
		}

		n.Type = t

如果 make 的第一个参数是切片类型,那么就会从参数中获取切片的长度 len 和容量 cap 并对这两个参数进行校验,其中包括:

  1. 切片的长度参数是否被传入;

  2. 切片的长度必须要小于或者等于切片的容量;

		case TSLICE:
			if i >= len(args) {
				yyerror("missing len argument to make(%v)", t)
				n.Type = nil
				return n
			}

			l = args[i]
			i++
			l = typecheck(l, ctxExpr) // l为切片长度参数
			var r *Node
			if i < len(args) {
				r = args[i] // r为切片容量参数
				i++
				r = typecheck(r, ctxExpr)
			}

			if Isconst(l, CTINT) && r != nil && Isconst(r, CTINT) && l.Val().U.(*Mpint).Cmp(r.Val().U.(*Mpint)) > 0 {
				yyerror("len larger than cap in make(%v)", t)
				n.Type = nil
				return n
			}

			n.Left = l
			n.Right = r
			n.Op = OMAKESLICE

除了对参数的数量和合法性进行校验,这段代码最后会将当前节点的操作 Op 改成 OMAKESLICE,方便后面编译阶段的处理。

第二种情况就是 make 的第一个参数是 map 类型,在这种情况下,第二个可选的参数就是哈希的初始大小,在默认情况下它的大小是 0,当前分支最后也会改变当前节点的 Op 属性:

		case TMAP:
			if i < len(args) {
				l = args[i]
				i++
				l = typecheck(l, ctxExpr)
				l = defaultlit(l, types.Types[TINT])
				if !checkmake(t, "size", l) {
					n.Type = nil
					return n
				}
				n.Left = l
			} else {
				n.Left = nodintconst(0)
			}
			n.Op = OMAKEMAP
		case TCHAN:
			l = nil
			if i < len(args) {
				l = args[i]
				i++
				l = typecheck(l, ctxExpr)
				l = defaultlit(l, types.Types[TINT])
				if !checkmake(t, "buffer", l) {
					n.Type = nil
					return n
				}
				n.Left = l
			} else {
				n.Left = nodintconst(0)
			}
			n.Op = OMAKECHAN

在类型检查的过程中,无论 make 的第一个参数是什么类型,都会对当前节点的 Op 类型进行修改并且对传入参数的合法性进行一定的验证。

2.3.4 小结

类型检查是 Go 语言编译的第二个阶段,在词法和语法分析之后我们得到了每个文件对应的抽象语法树,随后的类型检查会遍历抽象语法树中的节点,对每个节点的类型进行检验,找出其中存在的语法错误,在这个过程中也可能会对抽象语法树进行改写,这不仅能够去除一些不会被执行的代码、对代码进行优化以提高执行效率,而且也会修改 make、new 等关键字对应节点的操作类型。


原文链接

这里会重点介绍编译期间的静态类型检查,在 中,我们曾经介绍过 Go 语言编译器主程序中的 函数,其中有一段是这样的:

这段代码的执行过程可以分成两个部分,首先通过 文件中的 函数检查常量、类型、函数声明以及变量赋值语句的类型,然后使用 检查哈希中键的类型,我们会分几个部分对上述代码的实现原理进行分析。

编译器类型检查的主要逻辑都在 和 这中,其中 中逻辑不是特别多,它会做一些类型检查之前的准备工作。而核心的逻辑都在 中,这是由 switch 语句构成的 2000 行函数:

根据传入节点 Op 的类型进入不同的分支,其中包括加减乘数等操作符、函数调用、方法调用等 150 多种,因为节点的种类很多,所以这里只节选几个典型案例深入分析。

然后会根据当前节点的左节点不同,分三种情况更新 的类型,即三种不同的声明方式 []int、[...]int 和 [3]int,第一种相对来说比较简单,会直接调用 :

直接返回了一个 TSLICE 类型的结构体,元素的类型信息也会存储在结构体中。当遇到 [...]int 这种形式的数组类型时,会由 处理:

在最后,如果源代码中包含了数组的大小,那么会调用 初始化一个存储着数组中元素类型和数组大小的结构体:

三个不同的分支会分别处理数组和切片声明的不同形式,每一个分支都会更新 结构体中存储的类型并修改抽象语法树中的内容。通过对这个片段的分析,我们发现数组的长度是类型检查期间确定的,而 [...]int 这种声明形式也只是 Go 语言为我们提供的语法糖。

与处理切片时几乎完全相同,这里会通过 创建一个新的 TMAP 结构并将哈希的键值类型都存储到该结构体中:

代表当前哈希的节点最终也会被加入 mapqueue 队列,编译器会在后面的阶段对哈希键的类型进行再次检查,而检查键类型调用的其实是上面提到的 函数:

最后要介绍的是 Go 语言中很常见的内置函数 make,在类型检查阶段之前,无论是创建切片、哈希还是 Channel 用的都是 make 关键字,不过在类型检查阶段会根据创建的类型将 make 替换成特定的函数,后面的过程就不再会处理 OMAKE 类型的节点了,而是会依据生成的细分类型处理:

make 内置函数能够初始化的最后一种结构就是 了,从下面的代码我们可以发现第二个参数表示的就是 Channel 的缓冲区大小,如果不存在第二个参数,那么会创建缓冲区大小为 0 的 Channel:

make 和 new 这些内置函数其实并不会直接对应某些函数的实现,它们会在编译期间被转换成真正存在的其他函数,我们在下一节中会介绍编译器对它们做了什么。

Strong and weak typing https://en.wikipedia.org/wiki/Strong_and_weak_typing

Weak And Strong Typing https://wiki.c2.com/?WeakAndStrongTyping

https://en.wikipedia.org/wiki/Type_system#Static_type_checking

JavaScript 静态检查工具 https://flow.org/

为什么说“动态类型一时爽,代码重构火葬场”? https://www.zhihu.com/question/30072490

https://en.wikipedia.org/wiki/Type_system#Dynamic_type_checking_and_runtime_type_information

强类型和弱类型
静态类型检查
动态类型检查
Flow
2.1 概述
cmd/compile/internal/gc.Main
src/cmd/compile/internal/gc/typecheck.go
cmd/compile/internal/gc.typecheck
cmd/compile/internal/gc.checkMapKeys
cmd/compile/internal/gc.typecheck
cmd/compile/internal/gc.typecheck1
cmd/compile/internal/gc.typecheck
cmd/compile/internal/gc.typecheck1
cmd/compile/internal/gc.typecheck1
cmd/compile/internal/gc.Node
cmd/compile/internal/types.NewSlice
cmd/compile/internal/types.NewSlice
cmd/compile/internal/gc.typecheckcomplit
cmd/compile/internal/types.NewArray
cmd/compile/internal/gc.Node
cmd/compile/internal/types.NewMap
cmd/compile/internal/gc.checkMapKeys
生成中间代码
Channel
中间代码生成
↩︎
↩︎
↩︎
↩︎
↩︎
↩︎
golang-keyword-make