Vite 依赖预编译,缩短数倍的冷启动时间
前言前段时间,Vite 做了一个优化依赖预编译(Dependency Pre-Bundling)。简而言之,它指的是 Vite 会在 DevServer 启动前对需要预编译的依赖进行编译,然后在分析模块的导入(import)时会动态地应用编译过的依赖。这么一说,我想大家可能立马会抛出一个疑问:Vite 不是 No Bundle 吗?确实 Vite 是 No Bundle,但是依赖预编译并不是意味着
前言
前段时间,Vite 做了一个优化依赖预编译(Dependency Pre-Bundling)。简而言之,它指的是 Vite 会在 DevServer 启动前对需要预编译的依赖进行编译,然后在分析模块的导入(import)时会动态地应用编译过的依赖。
这么一说,我想大家可能立马会抛出一个疑问:Vite 不是 No Bundle 吗?确实 Vite 是 No Bundle,但是依赖预编译并不是意味着 Vite 要走向 Bundle,我们不要急着下定义,因为它的存在必然是有着其实际的价值。
那么,今天本文将会围绕以下 3 点来和大家一起从疑问点出发,深入浅出一番 Vite 的依赖预编译过程:
-
什么是依赖预编译
-
依赖预编译的作用
-
依赖预编译的实现(源码分析)
一、什么是依赖预编译
当你在项目中引用了 vue
和 lodash-es
,那么你在启动 Vite 的时候,你会在终端看到这样的输出内容:
而这表示 Vite 将你在项目中引入的 vue
和 lodash-es
进行了依赖预编译!这里,我们通过大白话认识一下 Vite 的依赖预编译:
-
默认情况下,Vite 会将 package.json 中生产依赖
dependencies
的部分启用依赖预编译,即会先对该依赖进行编译,然后将编译后的文件缓存在内存中(node_modules/.vite 文件下),在启动 DevServer 时直接请求该缓存内容。 -
在 vite.config.js 文件中配置
optimizeDeps
选项可以选择需要或不需要进行预编译的依赖的名称,Vite 则会根据该选项来确定是否对该依赖进行预编译。 -
在启动时添加
--force
options,可以用来强制重新进行依赖预编译。
需要注意,强制重新依赖预编译指的是忽略之前已编译的文件,直接重新编译。
所以,回到文章开始所说的疑问,这里我们可以这样理解依赖预编译,它的出现是一种优化,即没有它其实 No Bundle 也可以,有它更好(xiang)! 而且,依赖预编译并非无米之炊,Vite 也是受 Snowpack 的启发才提出的。
那么,下面我们就来了解一下依赖预编译的作用是什么,即优化的意义~
二、依赖预编译的作用
对于依赖预编译的作用,Vite 官方也做了详细的介绍。那么,这里我们通过结合图例的方式来认识一下,具体会是两点:
1. 兼容 CommonJS 和 AMD 模块的依赖
因为 Vite 的 DevServer 是基于浏览器的 Natvie ES Module 实现的,所以对于使用的依赖如果是 CommonJS 或 AMD 的模块,则需要进行模块类型的转化(ES Module)。
2. 减少模块间依赖引用导致过多的请求次数
通常我们引入的一些依赖,它自己又会一些其他依赖。官方文档中举了一个很经典的例子,当我们在项目中使用 lodash-es
的时候:
import { debounce } from "lodash-es"
如果在没用依赖预编译的情况下,我们打开页面的 Dev Tool 的 Network 面板:
可以看到此时大概有 600+ 和 lodash-es
相关的请求,并且所有请求加载花了 1.11 s,似乎还好?现在,我们来看一下使用依赖预编译的情况:
此时,只有 1 个和 lodash-es
相关的请求(经过预编译),并且所有请求加载才花了 142 ms,缩短了足足 7 倍多的时间! 而这里节省的时间,就是我们常说的冷启动时间。
那么,到这里我们就已经了解了 Vite 依赖预编译概念和作用。我想大家都会好奇这个过程又是怎么实现的?下面,我们就深入 Vite 源码来更进一步地认识依赖预编译过程!
三、依赖预编译的实现
在 Vite 源码中,默认的依赖预编译过程会在 DevServer 开启之前进行。这里,我们仍然以在项目中引入了 vue
和 lodash-es
依赖为例。
需要注意的是以下和源码相关的函数都是取的核心逻辑讲解(伪代码)。
3.1 Dev Server 启动前
首先,Vite 会创建一个 DevServer,也就是我们平常使用的本地开发服务器,这个过程是由 createServer
函数完成:
// packages/vite/src/node/server/index.ts
async function createServer(
inlineConfig: InlineConfig = {}
): Promise<ViteDevServer> {
...
// 通常情况下我们会命中这个逻辑
if (!middlewareMode && httpServer) {
// 重写 DevServer 的 listen,保证在 DevServer 启动前进行依赖预编译
const listen = httpServer.listen.bind(httpServer)
httpServer.listen = (async (port: number, ...args: any[]) => {
try {
...
// 依赖预编译相关
await runOptimize()
}
...
}) as any
...
} else {
await runOptimize()
}
...
}
可以看到在 DevServer 真正启动之前,它会先调用 runOptimize
函数,进行依赖预编译相关的处理(用 bind
进行简单的重写)。
runOptimize
函数:
// packages/vite/src/node/server/index.ts
const runOptimize = async () => {
// config.optimzizeCacheDir 指的是 node_modules/.vite
if (config.optimizeCacheDir) {
..
try {
server._optimizeDepsMetadata = await optimizeDeps(config)
}
..
server._registerMissingImport = createMissingImpoterRegisterFn(server)
}
}
runOptimize
函数负责的是调用和注册处理依赖预编译相关的 optimizeDeps
函数,具体来说会是两件事:
1. 进行依赖预编译
optimizeDeps
函数是 Vite 实现依赖预编译的核心函数,它会根据配置 vite.config.js 的 optimizeDeps
选项和 package.json 的 dependencies
的参数进行第一次预编译。它会返回解析 node_moduels/.vite/_metadata.json 文件后生成的对象(包含预编译后的依赖所在的文件位置、原文件所处的文件位置等)。
_metadata.json 文件:
{
"hash": "bade5e5e",
"browserHash": "830194d7",
"optimized": {
"vue": {
"file": "/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/.vite/vue.js",
"src": "/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/vue/dist/vue.runtime.esm-bundler.js",
"needsInterop": false
},
"lodash-es": {
"file": "/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/.vite/lodash-es.js",
"src": "/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/lodash-es/lodash.js",
"needsInterop": false
}
}
}
这里,我们来分别认识一下这 4 个属性的含义:
-
hash
由需要进行预编译的文件内容生成的,用于防止 DevServer 启动时重复编译相同的依赖,即依赖并没有发生变化,不需要重新编译。 -
browserHash
由hash
和在运行时发现的额外的依赖生成的,用于让预编译的依赖的浏览器请求无效。 -
optimized
包含每个进行过预编译的依赖,其对应的属性会描述依赖源文件路径src
和编译后所在路径file
。 -
needsInterop
主要用于在 Vite 进行依赖性导入分析,这是由importAnalysisPlugin
插件中的transformCjsImport
函数负责的,它会对需要预编译且为 CommonJS 的依赖导入代码进行重写。举个例子,当我们在 Vite 项目中使用react
时:
import React, { useState, createContext } from 'react'
此时 react
它是属于 needsInterop
为 true
的范畴,所以 importAnalysisPlugin
插件的会对导入 react
的代码进行重写:
import $viteCjsImport1_react from "/@modules/react.js";
const React = $viteCjsImport1_react;
const useState = $viteCjsImport1_react["useState"];
const createContext = $viteCjsImport1_react["createContext"];
之所以要进行重写的缘由是因为 CommonJS 的模块并不支持命名方式的导出。所以,如果不经过插件的转化,则会看到这样的异常:
Uncaught SyntaxError: The requested module '/@modules/react.js' does not provide an export named 'useState'
有兴趣继续往这方面了解的同学可以查看这个 PR https://github.com/vitejs/vite/pull/837,这里就不做过于详细的介绍了~
2. 注册依赖预编译相关函数
调用 createMissingImpoterRegisterFn
函数,它会返回一个函数,其仍然内部会调用 optimizeDeps
函数进行预编译,只是不同于第一次预编译过程,此时会传人一个 newDeps
,即新的需要进行预编译的依赖。
那么,显然无论是第一次预编译,还是后续的预编译,它们两者的实现都是调用的 optimizeDeps
函数。所以,下面我们来看一下 optimizeDeps
函数~
3.2 预编译实现核心 optimizeDeps 函数
optimizeDeps
函数被定义在 packages/vite/node/optimizer/index.ts 中,它负责对依赖进行预编译过程:
// packages/vite/node/optimizer/index.ts
export async function optimizeDeps(
config: ResolvedConfig,
force = config.server.force,
asCommand = false,
newDeps?: Record<string, string>
): Promise<DepOptimizationMetadata | null> {
...
}
由于 optimizeDeps
内部逻辑较为繁多,这里我们拆分为 5 个步骤讲解:
1. 读取该依赖此时的文件信息
既然是编译依赖,很显然的是每次编译都需要知道此时文件内容对应的 Hash 值,以便于依赖发生变化时可以重新进行依赖编译,从而应用最新的依赖内容。
所以,这里会先调用 getDepHash
函数获取依赖的 Hash 值:
// 获取该文件此时的 hash
const mainHash = getDepHash(root, config)
const data: DepOptimizationMetadata = {
hash: mainHash,
browserHash: mainHash,
optimized: {}
}
而对于
data
中的这三个属性,我们在上面已经介绍过了,这里就不重复论述了~
2. 对比缓存文件的 Hash
前面,我们也提及了如果启动 Vite 时使用了 --force
Option,则会强制重新进行依赖预编译。所以,当不是 --force
场景时,则会进行比较新旧依赖的 Hash 值的过程:
// 默认为 false
if (!force) {
let prevData
try {
// 获取到此时缓存(本地磁盘)中编译的文件信息
prevData = JSON.parse(fs.readFileSync(dataPath, 'utf-8'))
} catch (e) {}
// 对比此时的
if (prevData && prevData.hash === data.hash) {
log('Hash is consistent. Skipping. Use --force to override.')
return prevData
}
}
可以看到如果新旧依赖的 Hash 值相等的时候,则会直接返回旧的依赖内容。
3. 缓存失效或未缓存
如果上面的 Hash 不等,则表示缓存失效,所以会删除 cacheDir
文件夹,又或者此时未进行缓存,即第一次依赖预编译逻辑( cacheDir
文件夹不存在),则创建 cacheDir
文件夹:
if (fs.existsSync(cacheDir)) {
emptyDir(cacheDir)
} else {
fs.mkdirSync(cacheDir, { recursive: true })
}
需要注意的是,这里的
cacheDir
则指的是 node_modules/.vite 文件夹
前面在讲 DevServer 启动时,我们提及预编译过程会分为两种:第一次预编译和后续的预编译。两者的区别在于后者会传入一个 newDeps
,它表示新的需要进行预编译的依赖:
let deps: Record<string, string>, missing: Record<string, string>
if (!newDeps) {
;({ deps, missing } = await scanImports(config))
} else {
// 存在 newDeps 的时候,直接将 newDeps 赋值给 deps
deps = newDeps
missing = {}
}
并且,这里可以看到对于前者,第一次预编译,则会调用 scanImports
函数来找出和预编译相关的依赖 deps
,deps
会是一个对象:
{
lodash-es:'/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/lodash-es/lodash.js'
vue:'/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/vue/dist/vue.runtime.esm-bundler.js'
}
而 missing
则表示在 node_modules
中没找到的依赖。所以,当 missing
存在时,你会看到这样的提示:
scanImports
函数内部则是调用的一个名为dep-scan
的内部插件(Plugin)。这里就不讲解dep-scan
插件的具体实现了,有兴趣的同学可以自行了解哈~
那么,回到上面对于后者(newDeps
存在时)的逻辑则较为简单,会直接给 deps
赋值为 newDeps
,并且不需要处理 missing
。因为,newDeps
只有在后续导入并安装了新的 dependencies
依赖,才会传入的,此时是不存在 missing
的依赖的( Vite 内置的 importAnalysisPlugin
插件会提前过滤掉这些)。
4. 处理 optimizeDeps.include 相关依赖
在前面,我们也提及了需要进行编译的依赖也会由 vite.config.js 的 optimizeDeps
选项决定。所以,在处理完 dependencies
之后,接着需要处理 optimizeDeps
。
此时,会遍历前面从 dependencies
获取到的 deps
,判断 optimizeDeps.iclude
(数组)所指定的依赖是否存在,不存在则会抛出异常:
const include = config.optimizeDeps?.include
if (include) {
const resolve = config.createResolver({ asSrc: false })
for (const id of include) {
if (!deps[id]) {
const entry = await resolve(id)
if (entry) {
deps[id] = entry
} else {
throw new Error(
`Failed to resolve force included dependency: ${chalk.cyan(id)}`
)
}
}
}
}
5. 使用 esbuild 编译依赖
那么,在做好上述和预编译依赖相关的处理(文件 hash 生成、预编译依赖确定等)后。则进入依赖预编译的最后一步,使用 esbuild
来对相应的依赖进行编译:
...
const esbuildService = await ensureService()
await esbuildService.build({
entryPoints: Object.keys(flatIdDeps),
bundle: true,
format: 'esm',
...
})
...
ensureService
函数是 Vite 内部封装的 util
,它的本质是创建一个 esbuild
的 service
,使用 service.build
函数来完成编译过程。
此时,传入的 flatIdDeps
参数是一个对象,它是由上面提及的 deps
收集好的依赖创建的,它的作用是为 esbuild
进行编译的时候提供多路口(entry
),flatIdDeps
对象:
{
lodash-es:'/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/lodash-es/lodash.js'
moment:'/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/moment/dist/moment.js'
vue:'/Users/wjc/Documents/FE/demos/vite2.0-demo/node_modules/vue/dist/vue.runtime.esm-bundler.js'
}
好了,到此我们已经分析完了整个依赖预编译的实现 😲(手动给看到这的大家👍)。
那么,接下来在 DevServer 启动后,当模块需要请求经过预编译的依赖的时候,Vite 内部的 resolvePlugin
插件会解析该依赖是否存在 seen
中(seen
中会存储编译过的依赖映射),是则直接应用 node_modules/.vite
目录下对应的编译后的依赖,避免直接去请求编译前的依赖的情况出现,从而缩短冷启动的时间。
结语
通过了解 Vite 依赖预编译的作用、实现等相关知识,我想大家应该不会再去纠结 Bundle 或者 No Bundle 的问题了,仍然是那句话,存在即有价值。并且,依赖预编译这个知识点在面试场景下,可能也是一个很有趣的考题 😎。最后,如果文章中存在表达不当或错误的地方,欢迎大家提 Issue~
点赞 👍
通过阅读本篇文章,如果有收获的话,可以点个赞,这将会成为我持续分享的动力,感谢~
我是五柳,喜欢创新、捣鼓源码,专注于源码(Vue 3、Vite)、前端工程化、跨端等技术学习和分享,欢迎关注我的微信公众号:Code center。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)