在学习内存空间之前,我们需要对三种数据结构有一个清晰的理解。他们分别是 堆(heap)栈(stack)队列(queue)

栈数据结构

与 C/C++ 不同,JavaScript中并没有严格意义上区分栈内存与堆内存。

一般情况是基础数据类型,在栈内存中维护,引用数据类型,在堆内存中维护,栈内存和堆内存没有本质差别,但是栈内存是从地址高位开始分配,堆内存从地址低位开始分配,这里要结合函数调用栈来一起理解。

但是在某些场景,我们仍然需要基于 栈数据结构 的思维来实现一些功能,比如 JavaScript 的 执行上下文(关于执行上下文会在下一篇文章中总结)。执行上下文的执行顺序借用了 栈数据结构 的存取方式(也就是后面我们会经常提到的 函数调用栈)。

要简单理解栈的存取方式,我们可以通过类比乒乓球盒子来分析。如下图左侧。

这种乒乓球的存放方式与栈中存取数据的方式如出一辙。处于盒子中最顶层的乒乓球5,它一定是最后被放进去,但可以最先被使用。而我们想要使用底层的乒乓球1,就必须将上面的4个乒乓球取出来,让乒乓球1处于盒子顶层。这就是栈空间 先进后出,后进先出 的特点。图中已经详细的表明了栈空间的存储原理。

堆数据结构

堆数据结构是一种树状结构。它的存取数据的方式,则与书架与书非常相似。

书虽然也整齐的存放在书架上,但是我们只要知道书的名字,就可以很方便的取出我们想要的书,而不用像从乒乓球盒子里取乒乓一样,非得将上面的所有乒乓球拿出来才能取到中间的某一个乒乓球。好比在JSON格式的数据中,我们存储的key-value是可以无序的,因为顺序的不同并不影响我们的使用,我们只需要关心书的名字。

队列

在 JavaScript 中,理解队列数据结构的目的主要是为了清晰的明白 事件循环(Event Loop) 的机制到底是怎么回事。在后续的章节中会详细分析事件循环机制。

队列是一种 先进先出(FIFO) 的数据结构。正如排队过安检一样,排在队伍前面的人一定是最先过检的人。用以下的图示可以清楚的理解队列的原理。

变量对象与基础数据类型

在新的 ECMAScript 版本中,此处的变量对象,应该叫做环境记录对象更为标准,但变量对象更有利于简化理解内部机制,所以本系列文章不做更改。

JavaScript 的 执行上下文 生成之后,会创建一个叫做 变量对象 的特殊对象(具体会在下一篇文章与执行上下文一起总结),JavaScript 的基础数据类型往往都会保存在变量对象中。

基础数据类型都是一些简单的数据段,JavaScript 中有5种基础数据类型,分别是UndefinedNullBooleanNumberString。基础数据类型都是按值访问,我们可以直接操作保存在变量中的实际值。

ES6 中新加了一种基础数据类型 Symbol,可以先不用考虑他。

引用数据类型与堆内存

与其他语言不同,JS的引用数据类型,比如数组Array,它们值的大小是不固定的。引用数据类型的值是保存在堆内存中的对象。JavaScript不允许直接访问堆内存中的数据,因此我们不能直接操作对象的堆内存空间。在操作对象时,实际上是在操作对象的引用而不是实际的对象。因此,引用类型的值都是按引用访问的。这里的引用,我们可以理解为保存在变量对象中的一个地址,该地址与堆内存的实际值相关联。

为了更好的搞懂变量对象与堆内存,我们可以结合以下例子与图解进行理解。

1
2
3
4
5
6
var a1 = 0;   // 变量对象
var a2 = 'this is string'; // 变量对象
var a3 = null; // 变量对象

var b = { m: 20 }; // 变量b存在于变量对象中,{m: 20} 作为对象存在于堆内存中
var c = [1, 2, 3]; // 变量c存在于变量对象中,[1, 2, 3] 作为对象存在于堆内存中

当我们要访问堆内存中的引用数据类型时,实际上我们首先是从变量对象中获取了该对象的地址引用(或者地址指针),然后再从堆内存中取得我们需要的数据。

理解了JS的内存空间,我们就可以借助内存空间的特性来验证一下引用类型的一些特点。

在前端面试中我们常常会遇到这样一个类似的题目。

1
2
3
4
5
6
// demo01.js
var a = 20;
var b = a;
b = 30;

// 这时a的值是多少?
1
2
3
4
5
6
// demo02.js
var m = { a: 10, b: 20 }
var n = m;
n.a = 15;

// 这时m.a的值是多少

在变量对象中的数据发生复制行为时,系统会自动为新的变量分配一个新值。var b = a执行之后,a与b虽然值都等于20,但是他们其实已经是相互独立互不影响的值了。具体如图。所以我们修改了b的值以后,a的值并不会发生变化。

demo01图解
demo01图解

在demo02中,我们通过var n = m执行一次复制引用类型的操作。引用类型的复制同样也会为新的变量自动分配一个新的值保存在变量对象中,但不同的是,这个新的值,仅仅只是引用类型的一个地址指针。当地址指针相同时,尽管他们相互独立,但是在变量对象中访问到的具体对象实际上是同一个。如图所示。

因此当我改变n时,m也发生了变化。这就是引用类型的特性。

demo02图解
demo02图解

内存空间管理

因为JavaScript具有自动垃圾收集机制,所以我们在开发时好像不用关心内存的使用问题,内存的分配与回收都完全实现了自动管理。

JavaScript的内存生命周期:

  1. 分配你所需要的内存
  2. 使用分配到的内存(读、写)
  3. 不需要时将其释放、归还

为了便于理解,我们使用一个简单的例子来解释这个周期。

1
2
3
var a = 20;  // 在内存中给数值变量分配空间
alert(a + 100); // 使用内存
a = null; // 使用完毕之后,释放内存空间

第一步和第二步我们都很好理解,JavaScript在定义变量时就完成了内存分配。第三步释放内存空间则是我们需要重点理解的一个点。

JavaScript有自动垃圾收集机制,那么这个自动垃圾收集机制的原理是什么呢?其实很简单,就是 找出那些不再继续使用的值,然后释放其占用的内存。垃圾收集器会每隔固定的时间段就执行一次释放操作

在JavaScript中,最常用的是通过 标记清除 的算法来找到哪些对象是不再继续使用的,因此a = null其实仅仅只是做了一个释放引用的操作,让 a 原本对应的值失去引用,脱离执行环境,这个值会在下一次垃圾收集器执行操作时被找到并释放 。而在适当的时候解除引用,是为页面获得更好性能的一个重要方式。

需要注意的是,在局部作用域中,当函数执行完毕,局部变量也就没有存在的必要了,因此垃圾收集器很容易做出判断并回收。但是全局变量什么时候需要释放内存空间则很难判断,因此在我们的开发中,原则上应该避免使用全局变量。

要详细了解垃圾收集机制,建议阅读《JavaScript高级编程》中的4.3节。