前言
前面简单介绍了一下Kotlin
编译器插件是什么,以及如何一步一步开发一个Kotlin
编译器插件,但是之前开发的编译器插件是通过修改字节码的方式来修改产物的,只支持JVM
平台。今天主要在此基础上,介绍一下如何通过修改IR
的方式来修改Kotlin
编译器的产物,如何开发一个支持跨平台的Kotlin
编译器插件
本文主要包括以下内容:
Kotlin IR
是什么?- 如何遍历
Kotlin IR
? - 如何创建
Kotlin IR
元素? - 如何修改
Kotlin IR
? - 修改
Kotlin IR
实战
Kotlin IR
是什么?
Kotlin IR
即Kotlin
编译器中间表示,它从数据结构上来说也是一个抽象语法树。
因为Kotlin
是支持跨平台的,因此有着JVM
,Native
,JS
三个不同的编译器后端,为了在不同的后端之间共享逻辑,以及简化支持新的语言特性所需的工作,Kotiln
编译器引入IR
的概念,如下图所示:
在前文开发你的第一个 Kotlin 编译器插件中主要使用了ClassBuilderInterceptorExtension
在生成字节码的时机来修改产物
但是通过这种开发的插件是不支持Kotlin
跨平台的,很显然,Native
与JS
平台并不会生成字节码
这就是修改IR
的意义,让我们的编译器插件支持跨平台
正是为了支持跨平台,官方开发的很多插件,比如Compose
编译器插件,都是基于IrGenerationExtension
的
IrElement.dump()
使用
在从概念上理解了Kotlin IR
是什么样之后,我们再来看下Kotlin IR
在代码中到底长什么样?
Kotlin IR
语法树中的每个节点都实现了 IrElement
。语法树的元素包括模块、包、文件、类、属性、函数、参数、if
语句、函数调用等等,我们可以通过IrElement.dump
方法来看下它们在代码中的样子
// 1\. 注册IrGenerationExtension
IrGenerationExtension.registerExtension(project, TemplateIrGenerationExtension(messageCollector))
// 2\. IrGenerationExtension具体实现
class TemplateIrGenerationExtension() : IrGenerationExtension {
override fun generate(moduleFragment: IrModuleFragment, pluginContext: IrPluginContext) {
println(moduleFragment.dump())
}
}
通过以上方式就可以实现IrGenerationExtension
的注册与具体实现,如果我们的源代码如下所示:
fun main() {
println(debug())
}
fun debug(name: String = "World") = "Hello, $name!"
编译器插件将输出以下内容:
MODULE_FRAGMENT name:<main>
FILE fqName:<root> fileName:/var/folders/dk/9hdq9xms3tv916dk90l98c01p961px/T/Kotlin-Compilation3223338783072974845/sources/main.kt
// 1
FUN name:main visibility:public modality:FINAL <> () returnType:kotlin.Unit
BLOCK_BODY
CALL 'public final fun println (message: kotlin.Any?): kotlin.Unit [inline] declared in kotlin.io.ConsoleKt' type=kotlin.Unit origin=null
message: CALL 'public final fun debug (name: kotlin.String): kotlin.String declared in <root>' type=kotlin.String origin=null
// 2
FUN name:debug visibility:public modality:FINAL <> (name:kotlin.String) returnType:kotlin.String
VALUE_PARAMETER name:name index:0 type:kotlin.String
EXPRESSION_BODY
CONST String type=kotlin.String value="World"
// 3
BLOCK_BODY
RETURN type=kotlin.Nothing from='public final fun debug (name: kotlin.String): kotlin.String declared in <root>'
STRING_CONCATENATION type=kotlin.String
CONST String type=kotlin.String value="Hello, "
GET_VAR 'name: kotlin.String declared in <root>.debug' type=kotlin.String origin=null
CONST String type=kotlin.String value="!"
这就是Kotlin IR
在代码中的样子,可以看出它包括以下内容:
main
函数的声明,可见性,可变性,参数与返回值,可以看出这是一个名为public
的final
函数main
,它不接受任何参数,并返回Unit
debug
函数则有一个参数name
,该参数具有类型String
并且还返回一个String
,参数的默认值通过VALUE_PARAMETER
表示debug
函数的函数体通过BLOCK_BODY
表示,返回的内容是一个String
IrElement.dump()
在Kotlin
编译器插件的开发过程中是很实用的,通过它我们可以Dump
任意代码并查看其结构
如何遍历Kotlin IR
?
如前文所说,Kotlin IR
是一个抽象语法树,这意味着我们可以利用处理树结构的方式来处理Kotlin IR
我们可以利用访问者模式来遍历Kotlin IR
,我们知道,Kotlin IR
中的每个节点都实现了IrElement
接口,而IrElement
接口中正好有 2 个访问者模式相关的函数。
fun <R, D> accept(visitor: IrElementVisitor<R, D>, data: D): R
fun <D> acceptChildren(visitor: IrElementVisitor<Unit, D>, data: D): Unit
接下来我们看一下在IrClass
中两个方法的实现:
override fun <R, D> accept(visitor: IrElementVisitor<R, D>, data: D): R =
visitor.visitClass(this, data)
override fun <D> acceptChildren(visitor: IrElementVisitor<Unit, D>, data: D) {
thisReceiver?.accept(visitor, data)
typeParameters.forEach { it.accept(visitor, data) }
declarations.forEach { it.accept(visitor, data) }
}
可以看出:acceptChildren
方法会调用所有children
的accept
方法,而accept
方法则是调用对应element
的visit
方法,最后都会调用到visitElement
方法
因此我们可以通过以下方式遍历IR
树
// 1\. 注册 visitor
moduleFragment.accept(RecursiveVisitor(), null)
// 2\. visitor 实现
class RecursiveVisitor : IrElementVisitor<Unit, Nothing?> {
override fun visitElement(element: IrElement, data: Nothing?) {
element.acceptChildren(this, data)
}
}
数据输入与输出
上文当我们使用IrElementVisitor
时,忽略了它的两个泛型参数,一个用于定义data
(每个visit
函数接受的参数类型,另一个用于定义每个visitor
函数的返回类型。
输入值data
可用于在整个 IR
树中传递上下文信息。例如,可以用于打印出元素细节时使用的当前缩进间距。
class StringIndentVisitor : IrElementVisitor<Unit, String> {
override fun visitElement(element: IrElement, data: String) {
println("$data${render(element)} {")
element.acceptChildren(this, " $data")
println("$data}")
}
}
而输出类型可用于返回调用访问者的结果,在后面的IR
转换中非常实用,这点我们后面再介绍。
如何创建Kotlin IR
元素?
上文我们已经介绍了如何遍历Kotlin IR
,接下来我们来看下如何创建Kotlin IR
元素
class TemplateIrGenerationExtension() : IrGenerationExtension {
override fun generate(moduleFragment: IrModuleFragment, pluginContext: IrPluginContext) {
println(moduleFragment.dump())
}
}
当定义IrGenerationExtension
时,我们之前使用了moduleFragment
参数,接下来我们来看下另一个参数:IrPluginContext
,它可以为插件提供有关正在编译的当前模块之外的内容的上下文信息
从IrPluginContext
实例中,我们可以获得IrFactory
的实例。这个工厂类是 Kotlin
编译器插件创建自己的 IR
元素的方式。它包含许多用于构建IrClass
、IrSimpleFunction
、IrProperty
等实例的函数。
IrFactory
在构建声明时很有用:比如类、函数、属性等,但是在构建语句和表达式时,您将需要IrBuilder
的实例。更重要的是,您将需要一个IrBuilderWithScope
实例。有了这个构建器实例,IR
表达式可以使用更多的扩展函数。
在了解了这些基础内容后,我们来看一个实例
fun main() {
println("Hello, World!")
}
这段代码很简单,我们来看下如何实用IR
构建如上内容:
override fun generate(moduleFragment: IrModuleFragment, pluginContext: IrPluginContext) {
// 1\. 通过pluginContext.irBuiltIns获取Kotlin语言中的内置内容,在这里我们获取了any与unit类型
val typeNullableAny = pluginContext.irBuiltIns.anyNType
val typeUnit = pluginContext.irBuiltIns.unitType
// 2\. 如果您需要的不是语言本身内置的,而是来自依赖项(如标准库),您可以使用这些IrPluginContext.reference*()函数来查找所需的IrSymbol
val funPrintln = pluginContext.referenceFunctions(FqName("kotlin.io.println"))
.single {
val parameters = it.owner.valueParameters
parameters.size == 1 && parameters[0].type == typeNullableAny
}
// 3\. 使用irFactory构建一个函数
val funMain = pluginContext.irFactory.buildFun {
name = Name.identifier("main")
visibility = DescriptorVisibilities.PUBLIC // default
modality = Modality.FINAL // default
returnType = typeUnit
}.also { function ->
// 4\. 设置function.body,构建函数体
function.body = DeclarationIrBuilder(pluginContext, function.symbol).irBlockBody {
通过+号将此表达式添加到块中
+irCall(funPrintln).also { call ->
call.putValueArgument(0, irString("Hello, World!"))
}
}
}
println(funMain.dump())
}
以上代码主要做了这么几件事:
- 通过
pluginContext.irBuiltIns
获取Kotlin
语言中的内置内容,在这里我们获取了any
与unit
类型 - 如果您需要的不是语言本身内置的,而是来自依赖项(如标准库),您可以使用这些
IrPluginContext.reference*()
函数来查找所需的IrSymbol
,同时由于函数支持重载,我们这里需要通过single
方法过滤出具有所需签名的单个函数 - 使用
irFactory
构建一个函数,可以设置各种属性,如名称、可见性、可变性和返回类型等 - 通过设置
function.body
构建函数体,irBlockBody
会创建出一个IrBuilderWithScope
,在其中可以可以调用各种扩展方法创建IR
,比如调用irCall
。同时需要通过IrCall
上的+
运算符将此函数调用添加到块中
如上所示,通过这段代码就可以构建出我们想要的代码了
如何修改Kotlin IR
?
在了解了如何遍历与创建IR
之后,接下来就是修改了。
与之前遍历IR
树类似,IrElement
接口也包含两个与变换相关的接口
fun <D> transform(transformer: IrElementTransformer<D>, data: D): IrElement = accept(transformer, data)
fun <D> transformChildren(transformer: IrElementTransformer<D>, data: D): Unit
transform
函数默认委托访问者函数accept
,子类中的函数覆盖通常只需要将函数的返回类型覆盖为更具体的类型。例如,IrFile
中的transform
函数如下所示。
override fun <D> transform(transformer: IrElementTransformer<D>, data: D): IrFile =
accept(transformer, data) as IrFile
而transformChildren
方法与遍历访问每个元素的所有子元素一样,transformChildren
函数允许对每个子元素进行变换。例如,让我们看看IrClass
的实现。
override fun <D> transformChildren(transformer: IrElementTransformer<D>, data: D) {
thisReceiver = thisReceiver?.transform(transformer, data)
typeParameters = typeParameters.transformIfNeeded(transformer, data)
declarations.transformInPlace(transformer, data)
}
总得来说,transform
与transformChildren
方法最后也会调用到各种visit
方法,我们可以在其中修改IR
的内容
在了解了这些基础之后,我们可以开始修改Kotlin IR
的实战了
修改Kotlin IR
实战
目标代码
接下来我们来看一个修改Kotlin IR
的实例,比如以下代码
@DebugLog
fun greet(greeting: String = "Hello", name: String = "World"): String {
return "${'$'}greeting, ${'$'}name!"
}
我们希望添加了@DebugLog
注解的方法,在函数的入口与出口都通过println
打印信息,在变换后代码如下所示:
@DebugLog
fun greet(greeting: String = "Hello", name: String = "World"): String {
println("⇢ greet(greeting=$greeting, name=$name)")
val startTime = TimeSource.Monotonic.markNow()
try {
val result = "${'$'}greeting, ${'$'}name!"
println("⇠ greet [${startTime.elapsedNow()}] = $result")
return result
} catch (t: Throwable) {
println("⇠ greet [${startTime.elapsedNow()}] = $t")
throw t
}
}
接下来我们就一步一步来实现这个目标
注册与定义Transformer
// 1\. 注册Transformer
moduleFragment.transform(DebugLogTransformer(pluginContext, debugLogAnnotation, funPrintln), null)
// 2\. 定义Transformer
class DebugLogTransformer(
private val pluginContext: IrPluginContext,
private val debugLogAnnotation: IrClassSymbol,
private val logFunction: IrSimpleFunctionSymbol,
) : IrElementTransformerVoidWithContext() {
private val typeUnit = pluginContext.irBuiltIns.unitType
private val classMonotonic =
pluginContext.referenceClass(FqName("kotlin.time.TimeSource.Monotonic"))!!
override fun visitFunctionNew(declaration: IrFunction): IrStatement {
val body = declaration.body
if (body != null && declaration.hasAnnotation(debugLogAnnotation)) {
declaration.body = irDebug(declaration, body)
}
return super.visitFunctionNew(declaration)
}
这一步主要做了这么几件事:
- 注册
Transfomer
,传入用于构建IR
元素的IrPluginContext
,需要处理的注解符号IrClassSymbol
,用于记录调试消息的函数的IrSimpleFunctionSymbol
- 基于
IrElementTransformerVoidWithContext
类扩展,自定义Transformer
,这个Transformer
不接受输入数据,并维护一个它访问过的各种IR
元素的内部堆栈 - 定义一些本地属性来引用已知类型、类和函数,比如
typeUnit
与classMonotonic
- 重写
visitFunctionNew
函数来拦截函数语句的转换,我们需要检查它是否有body
并且拥有目标注解@DebugLog
方法进入打点
进入函数时,我们需要调用println
显示函数名称和函数入参。
private fun IrBuilderWithScope.irDebugEnter(
function: IrFunction
): IrCall {
val concat = irConcat()
concat.addArgument(irString("⇢ ${function.name}("))
for ((index, valueParameter) in function.valueParameters.withIndex()) {
if (index > 0) concat.addArgument(irString(", "))
concat.addArgument(irString("${valueParameter.name}="))
concat.addArgument(irGet(valueParameter))
}
concat.addArgument(irString(")"))
return irCall(logFunction).also { call ->
call.putValueArgument(0, concat)
}
}
在这里我们主要用到了irConcat
来拼接字符串,以及irGet
来获取参数值,这些参数经过concat
拼接后通过println
一起输出
方法结束时打点
方法退出时,我们要记录结果或抛出的异常。如果函数返回 Unit
我们可以跳过显示结果,因为已知它什么都没有。
private fun IrBuilderWithScope.irDebugExit(
function: IrFunction,
startTime: IrValueDeclaration,
result: IrExpression? = null
): IrCall {
val concat = irConcat()
concat.addArgument(irString("⇠ ${function.name} ["))
concat.addArgument(irCall(funElapsedNow).also { call ->
call.dispatchReceiver = irGet(startTime)
})
if (result != null) {
concat.addArgument(irString("] = "))
concat.addArgument(result)
} else {
concat.addArgument(irString("]"))
}
return irCall(logFunction).also { call ->
call.putValueArgument(0, concat)
}
}
这里我们需要记录方法执行时间,startTime
通过IrValueDeclaration
传入,这是一个局部变量,可以通过irGet
读取
为了调用kotlin.time.TimeMark.elapsedNow
方法,我们可以调用funElapsedNow
符号,并将startTime
作为dispatcherReceiver
,这样就能计算出方法耗时
result
参数是可选的表达式,它可以是函数的返回值,或者是抛出的异常,这些参数经过concat
拼接后通过println
一起输出
组装函数体
private fun irDebug(
function: IrFunction,
body: IrBody
): IrBlockBody {
return DeclarationIrBuilder(pluginContext, function.symbol).irBlockBody {
+irDebugEnter(function)
// ...
val tryBlock = irBlock(resultType = function.returnType) {
if (function.returnType == typeUnit) +irDebugExit(function, startTime)
}.transform(DebugLogReturnTransformer(function, startTime), null)
+IrTryImpl(startOffset, endOffset, tryBlock.type).also { irTry ->
irTry.tryResult = tryBlock
irTry.catches += irCatch(throwable, irBlock {
+irDebugExit(function, startTime, irGet(throwable))
+irThrow(irGet(throwable))
})
}
}
}
这一部分主要是构建出try,catch
块,并在相关部分调用irDebugEnter
与irDebugExit
方法,完整代码就不在这里缀述了
经过这一步,支持跨平台的Kotlin
编译器插件就开发完成了,添加了@DebugLog
注解的方法在进入与退出时,都会打印相关的日志
总结
本文主要介绍了Kotlin IR
是什么,如何对Kotlin IR
进行增删改查,如何一步步开发一个支持跨平台的Kotlin
编译器插件,希望对你有所帮助~
作者:程序员江同学
链接:https://juejin.cn/post/7147468443413905416
来源:稀土掘金
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/118824.html