作為一名 Java 程序員,我們在日常工作中使用這款面向?qū)ο蟮木幊陶Z言時,做的最頻繁的操作大概就是去創(chuàng)建一個個的對象了。對象的創(chuàng)建方式雖然有很多,可以通過new
、反射、clone
、反序列化等不同方式來創(chuàng)建,但最終使用時對象都要被放到內(nèi)存中,那么你知道在內(nèi)存中的 java 對象是由哪些部分組成、又是怎么存儲的嗎?
本文將基于代碼進行實例測試,詳細探討對象在內(nèi)存中的組成結(jié)構(gòu)。全文目錄結(jié)構(gòu)如下:
- 1、對象內(nèi)存結(jié)構(gòu)概述
- 2、JOL 工具簡介
- 3、對象頭
- 4、實例數(shù)據(jù)
- 5、對齊填充字節(jié)
- 6、總結(jié)
文中代碼基于 JDK 1.8.0_261,64-Bit HotSpot 運行
1、對象內(nèi)存結(jié)構(gòu)概述
在介紹對象在內(nèi)存中的組成結(jié)構(gòu)前,我們先簡要回顧一個對象的創(chuàng)建過程:
1、jvm 將對象所在的class
文件加載到方法區(qū)中
2、jvm 讀取main
方法入口,將main
方法入棧,執(zhí)行創(chuàng)建對象代碼
3、在main
方法的棧內(nèi)存中分配對象的引用,在堆中分配內(nèi)存放入創(chuàng)建的對象,并將棧中的引用指向堆中的對象
所以當對象在實例化完成之后,是被存放在堆內(nèi)存中的,這里的對象由 3 部分組成,如下圖所示:
對各個組成部分的功能簡要進行說明:
- 對象頭:對象頭存儲的是對象在運行時狀態(tài)的相關(guān)信息、指向該對象所屬類的元數(shù)據(jù)的指針,如果對象是數(shù)組對象那么還會額外存儲對象的數(shù)組長度
- 實例數(shù)據(jù):實例數(shù)據(jù)存儲的是對象的真正有效數(shù)據(jù),也就是各個屬性字段的值,如果在擁有父類的情況下,還會包含父類的字段。字段的存儲順序會受到數(shù)據(jù)類型長度、以及虛擬機的分配策略的影響
- 對齊填充字節(jié):在 java 對象中,需要對齊填充字節(jié)的原因是,64 位的 jvm 中對象的大小被要求向8字節(jié)對齊,因此當對象的長度不足8字節(jié)的整數(shù)倍時,需要在對象中進行填充操作。注意圖中對齊填充部分使用了虛線,這是因為填充字節(jié)并不是固定存在的部分,這點在后面計算對象大小時具體進行說明
2、JOL 工具簡介
在具體開始研究對象的內(nèi)存結(jié)構(gòu)之前,先介紹一下我們要用到的工具,openjdk
官網(wǎng)提供了查看對象內(nèi)存布局的工具jol (java object layout)
,可在maven
中引入坐標:
<dependency>
<groupId>org.openjdk.jol</groupId>
<artifactId>jol-core</artifactId>
<version>0.14</version>
</dependency>
在代碼中使用jol
提供的方法查看 jvm 信息:
System.out.println(VM.current().details());
通過打印出來的信息,可以看到我們使用的是 64 位 jvm,并開啟了指針壓縮,對象默認使用 8 字節(jié)對齊方式。通過jol
查看對象內(nèi)存布局的方法,將在后面的例子中具體展示,下面開始對象內(nèi)存布局的正式學習。
3、對象頭
首先看一下對象頭(Object header
)的組成部分,根據(jù)普通對象和數(shù)組對象的不同,結(jié)構(gòu)將會有所不同。只有當對象是數(shù)組對象才會有數(shù)組長度部分,普通對象沒有該部分,如下圖所示:
在對象頭中mark word
占8字節(jié),默認開啟指針壓縮的情況下klass pointer
占4字節(jié),數(shù)組對象的數(shù)組長度占4字節(jié)。在了解了對象頭的基礎(chǔ)結(jié)構(gòu)后,現(xiàn)在以一個不包含任何屬性的空對象為例,查看一下它的內(nèi)存布局,創(chuàng)建User
類:
public class User {
}
使用jol
查看對象頭的內(nèi)存布局:
public static void main(String[] args) {
User user=new User();
//查看對象的內(nèi)存布局
System.out.println(ClassLayout.parseInstance(user).toPrintable());
}
執(zhí)行代碼,查看打印信息:
OFFSET
:偏移地址,單位為字節(jié)SIZE
:占用內(nèi)存大小,單位為字節(jié)TYPE
:Class
中定義的類型DESCRIPTION
:類型描述,Obejct header
表示對象頭,alignment
表示對齊填充VALUE
:對應(yīng)內(nèi)存中存儲的值
當前對象共占用16字節(jié),因為8字節(jié)標記字加4字節(jié)的類型指針,不滿足向8字節(jié)對齊,因此需要填充4個字節(jié):
8B (mark word) + 4B (klass pointer) + 0B (instance data) + 4B (padding)
這樣我們就通過直觀的方式,了解了一個不包含屬性的最簡單的空對象,在內(nèi)存中的基本組成是怎樣的。在此基礎(chǔ)上,我們來深入學習對象頭中各個組成部分。
3.1 Mark Word 標記字
在對象頭中,mark word
一共有64個bit,用于存儲對象自身的運行時數(shù)據(jù),標記對象處于以下5種狀態(tài)中的某一種:
3.1.1 基于mark word的鎖升級
在jdk6 之前,通過synchronized
關(guān)鍵字加鎖時使用無差別的的重量級鎖,重量級鎖會造成線程的串行執(zhí)行,并且使cpu在用戶態(tài)和核心態(tài)之間頻繁切換。隨著對synchronized
的不斷優(yōu)化,提出了鎖升級的概念,并引入了偏向鎖、輕量級鎖、重量級鎖。在mark word
中,鎖(lock
)標志位占用2個bit,結(jié)合1個bit偏向鎖(biased_lock
)標志位,這樣通過倒數(shù)的3位,就能用來標識當前對象持有的鎖的狀態(tài),并判斷出其余位存儲的是什么信息。
基于mark word
的鎖升級的流程如下:
1、鎖對象剛創(chuàng)建時,沒有任何線程競爭,對象處于無鎖狀態(tài)。在上面打印的空對象的內(nèi)存布局中,根據(jù)大小端,得到最后8位是00000001
,表示處于無鎖態(tài),并且處于不可偏向狀態(tài)。這是因為在jdk中偏向鎖存在延遲4秒啟動,也就是說在jvm啟動后4秒后創(chuàng)建的對象才會開啟偏向鎖,我們通過jvm參數(shù)取消這個延遲時間:
-XX:BiasedLockingStartupDelay=0
這時最后3位為101
,表示當前對象的鎖沒有被持有,并且處于可被偏向狀態(tài)。
2、在沒有線程競爭的條件下,第一個獲取鎖的線程通過CAS
將自己的threadId
寫入到該對象的mark word
中,若后續(xù)該線程再次獲取鎖,需要比較當前線程threadId
和對象mark word
中的threadId
是否一致,如果一致那么可以直接獲取,并且鎖對象始終保持對該線程的偏向,也就是說偏向鎖不會主動釋放。
使用代碼進行測試同一個線程重復(fù)獲取鎖的過程:
public static void main(String[] args) {
User user=new User();
synchronized (user){
System.out.println(ClassLayout.parseInstance(user).toPrintable());
}
System.out.println(ClassLayout.parseInstance(user).toPrintable());
synchronized (user){
System.out.println(ClassLayout.parseInstance(user).toPrintable());
}
}
執(zhí)行結(jié)果:
可以看到一個線程對一個對象加鎖、解鎖、重新獲取對象的鎖時,mark word
都沒有發(fā)生變化,偏向鎖中的當前線程指針始終指向同一個線程。
3、當兩個或以上線程交替獲取鎖,但并沒有在對象上并發(fā)的獲取鎖時,偏向鎖升級為輕量級鎖。在此階段,線程采取CAS
的自旋方式嘗試獲取鎖,避免阻塞線程造成的cpu在用戶態(tài)和內(nèi)核態(tài)間轉(zhuǎn)換的消耗。測試代碼如下:
public static void main(String[] args) throws InterruptedException {
User user=new User();
synchronized (user){
System.out.println("--MAIN--:"+ClassLayout.parseInstance(user).toPrintable());
}
Thread thread = new Thread(() -> {
synchronized (user) {
System.out.println("--THREAD--:"+ClassLayout.parseInstance(user).toPrintable());
}
});
thread.start();
thread.join();
System.out.println("--END--:"+ClassLayout.parseInstance(user).toPrintable());
}
先直接看一下結(jié)果:
整個加鎖狀態(tài)的變化流程如下:
- 主線程首先對 user 對象加鎖,首次加鎖為
101
偏向鎖 - 子線程等待主線程釋放鎖后,對user對象加鎖,這時將偏向鎖升級為
00
輕量級鎖 - 輕量級鎖解鎖后,user 對象無線程競爭,恢復(fù)為
001
無鎖態(tài),并且處于不可偏向狀態(tài)。如果之后有線程再嘗試獲取 user 對象的鎖,會直接加輕量級鎖,而不是偏向鎖
4、當兩個或以上線程并發(fā)的在同一個對象上進行同步時,為了避免無用自旋消耗 cpu,輕量級鎖會升級成重量級鎖。這時mark word
中的指針指向的是monitor
對象(也被稱為管程或監(jiān)視器鎖)的起始地址。測試代碼如下:
public static void main(String[] args) {
User user = new User();
new Thread(() -> {
synchronized (user) {
System.out.println("--THREAD1--:" + ClassLayout.parseInstance(user).toPrintable());
try {
TimeUnit.SECONDS.sleep(2);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}).start();
new Thread(() -> {
synchronized (user) {
System.out.println("--THREAD2--:" + ClassLayout.parseInstance(user).toPrintable());
try {
TimeUnit.SECONDS.sleep(2);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}).start();
}
查看結(jié)果:
可以看到,在兩個線程同時競爭user對象的鎖時,會升級為10
重量級鎖。
3.1.2 其他信息
對mark word
中其他重要信息進行說明:
hashcode
:無鎖態(tài)下的hashcode
采用了延遲加載技術(shù),在第一次調(diào)用hashCode()
方法時才會計算寫入。對這一過程進行驗證:
public static void main(String[] args) {
User user=new User();
//打印內(nèi)存布局
System.out.println(ClassLayout.parseInstance(user).toPrintable());
//計算hashCode
System.out.println(user.hashCode());
//再次打印內(nèi)存布局
System.out.println(ClassLayout.parseInstance(user).toPrintable());
}
可以看到,在沒有調(diào)用hashCode()
方法前,31位的哈希值不存在,全部填充為0。在調(diào)用方法后,根據(jù)大小端,被填充的數(shù)據(jù)為:
1011001001101100011010010101101
將2進制轉(zhuǎn)換為10進制,對應(yīng)哈希值1496724653
。需要注意,只有在調(diào)用沒有被重寫的Object.hashCode()
方法或System.identityHashCode(Object)
方法才會寫入mark word
,執(zhí)行用戶自定義的hashCode()
方法不會被寫入。
大家可能會注意到,當對象被加鎖后,mark word
中就沒有足夠空間來保存hashCode
了,這時hashcode
會被移動到重量級鎖的Object Monitor
中。
epoch
:偏向鎖的時間戳- 分代年齡(
age
):在jvm
的垃圾回收過程中,每當對象經(jīng)過一次Young GC
,年齡都會加1,這里4位來表示分代年齡最大值為15,這也就是為什么對象的年齡超過15后會被移到老年代的原因。在啟動時可以通過添加參數(shù)來改變年齡閾值:
-XX:MaxTenuringThreshold
當設(shè)置的閾值超過15時,啟動時會報錯:
3.2 Klass Pointer 類型指針
Klass Pointer
是一個指向方法區(qū)中Class
信息的指針,虛擬機通過這個指針確定該對象屬于哪個類的實例。在64位的JVM中,支持指針壓縮功能,根據(jù)是否開啟指針壓縮,Klass Pointer
占用的大小將會不同:
- 未開啟指針壓縮時,類型指針占用8B (64bit)
- 開啟指針壓縮情況下,類型指針占用4B (32bit)
在jdk6
之后的版本中,指針壓縮是被默認開啟的,可通過啟動參數(shù)開啟或關(guān)閉該功能:
#開啟指針壓縮:
-XX:+UseCompressedOops
#關(guān)閉指針壓縮:
-XX:-UseCompressedOops
還是以剛才的User
類為例,關(guān)閉指針壓縮后再次查看對象的內(nèi)存布局:
對象大小雖然還是16字節(jié),但是組成發(fā)生了改變,8字節(jié)標記字加8字節(jié)類型指針,已經(jīng)能滿足對齊條件,因此不需要填充。
8B (mark word) + 8B (klass pointer) + 0B (instance data) + 0B (padding)
3.2.1 指針壓縮原理
在了解了指針壓縮的作用后,我們來看一下指針壓縮是如何實現(xiàn)的。首先在不開啟指針壓縮的情況下,一個對象的內(nèi)存地址使用64位表示,這時能描述的內(nèi)存地址范圍是:
0 ~ 2^64-1
在開啟指針壓縮后,使用4個字節(jié)也就是32位,可以表示2^32
個內(nèi)存地址,如果這個地址是真實地址的話,由于CPU尋址的最小單位是Byte
,那么就是4GB內(nèi)存。這對于我們來說是遠遠不夠的,但是之前我們說過,java中對象默認使用了8字節(jié)對齊,也就是說1個對象占用的空間必須是8字節(jié)的整數(shù)倍,這樣就創(chuàng)造了一個條件,使jvm在定位一個對象時不需要使用真正的內(nèi)存地址,而是定位到由java進行了8字節(jié)映射后的地址(可以說是一個映射地址的編號)。
映射過程也非常簡單,由于使用了8字節(jié)對齊后每個對象的地址偏移量后3位必定為0,所以在存儲的時候可以將后3位0抹除(轉(zhuǎn)化為bit
是抹除了最后24位),在此基礎(chǔ)上再去掉最高位,就完成了指針從8字節(jié)到4字節(jié)的壓縮。而在實際使用時,在壓縮后的指針后加3位0,就能夠?qū)崿F(xiàn)向真實地址的映射。
完成壓縮后,現(xiàn)在指針的32位中的每一個bit
,都可以代表8個字節(jié),這樣就相當于使原有的內(nèi)存地址得到了8倍的擴容。所以在8字節(jié)對齊的情況下,32位最大能表示2^32*8=32GB
內(nèi)存,內(nèi)存地址范圍是:
0 ~ (2^32-1)*8
由于能夠表示的最大內(nèi)存是32GB,所以如果配置的最大的堆內(nèi)存超過這個數(shù)值時,那么指針壓縮將會失效。配置jvm啟動參數(shù):
-Xmx32g
查看對象內(nèi)存布局:
此時,指針壓縮失效,指針長度恢復(fù)到8字節(jié)。那么如果業(yè)務(wù)場景內(nèi)存超過32GB怎么辦呢,可以通過修改默認對齊長度進行再次擴展,我們將對齊長度修改為16字節(jié):
-XX:ObjectAlignmentInBytes=16 -Xmx32g
可以看到指針壓縮后占4字節(jié),同時對象向16字節(jié)進行了填充對齊,按照上面的計算,這時配置最大堆內(nèi)存為64GB時指針壓縮才會失效。
對指針壓縮做一下簡單總結(jié):
- 通過指針壓縮,利用對齊填充的特性,通過映射方式達到了內(nèi)存地址擴展的效果
- 指針壓縮能夠節(jié)省內(nèi)存空間,同時提高了程序的尋址效率
- 堆內(nèi)存設(shè)置時最好不要超過32GB,這時指針壓縮將會失效,造成空間的浪費
- 此外,指針壓縮不僅可以作用于對象頭的類型指針,還可以作用于引用類型的字段指針,以及引用類型數(shù)組指針
3.3 數(shù)組長度
如果當對象是一個數(shù)組對象時,那么在對象頭中有一個保存數(shù)組長度的空間,占用4字節(jié)(32bit)空間。通過下面代碼進行測試:
public static void main(String[] args) {
User[] user=new User[2];
//查看對象的內(nèi)存布局
System.out.println(ClassLayout.parseInstance(user).toPrintable());
}
運行代碼,結(jié)果如下:
內(nèi)存結(jié)構(gòu)從上到下分別為:
- 8字節(jié)
mark word
- 4字節(jié)
klass pointer
- 4字節(jié)數(shù)組長度,值為2,表示數(shù)組中有兩個元素
- 開啟指針壓縮后每個引用類型占4字節(jié),數(shù)組中兩個元素共占8字節(jié)
需要注意的是,在未開啟指針壓縮的情況下,在數(shù)組長度后會有一段對齊填充字節(jié):
通過計算:
8B (mark word) + 8B (klass pointer) + 4B (array length) + 16B (instance data)=36B
需要向8字節(jié)進行對齊,這里選擇將對齊的4字節(jié)添加在了數(shù)組長度和實例數(shù)據(jù)之間。
4、實例數(shù)據(jù)
實例數(shù)據(jù)(Instance Data
)保存的是對象真正存儲的有效信息,保存了代碼中定義的各種數(shù)據(jù)類型的字段內(nèi)容,并且如果有繼承關(guān)系存在,子類還會包含從父類繼承過來的字段。
- 基本數(shù)據(jù)類型:
Type | Bytes |
---|---|
byte,boolean | 1 |
char,short | 2 |
int,float | 4 |
long,double | 8 |
- 引用數(shù)據(jù)類型:
開啟指針壓縮情況下占8字節(jié),開啟指針壓縮后占4字節(jié)。
4.1 字段重排序
給User類添加基本數(shù)據(jù)類型的屬性字段:
public class User {
int id,age,weight;
byte sex;
long phone;
char local;
}
查看內(nèi)存布局:
可以看到,在內(nèi)存中,屬性的排列順序與在類中定義的順序不同,這是因為jvm會采用字段重排序技術(shù),對原始類型進行重新排序,以達到內(nèi)存對齊的目的。具體規(guī)則遵循如下:
- 按照數(shù)據(jù)類型的長度大小,從大到小排列
- 具有相同長度的字段,會被分配在相鄰位置
- 如果一個字段的長度是L個字節(jié),那么這個字段的偏移量(
OFFSET
)需要對齊至nL
(n為整數(shù))
上面的前兩條規(guī)則相對容易理解,這里通過舉例對第3條進行解釋:
因為long
類型占8字節(jié),所以它的偏移量必定是8n,再加上前面對象頭占12字節(jié),所以long
類型變量的最小偏移量是16。通過打印對象內(nèi)存布局可以發(fā)現(xiàn),當對象頭不是8字節(jié)的整數(shù)倍時(只存在8n+4
字節(jié)情況),會按從大到小的順序,使用4、2、1字節(jié)長度的屬性進行補位。為了和對齊填充進行區(qū)分,可以稱其為前置補位,如果在補位后仍然不滿足8字節(jié)整數(shù)倍,會進行對齊填充。在存在前置補位的情況下,字段的排序會打破上面的第一條規(guī)則。
因此在上面的內(nèi)存布局中,先使用4字節(jié)的int
進行前置補位,再按第一條規(guī)則從大到小順序進行排列。如果我們刪除3個int
類型的字段,再查看內(nèi)存布局:
char
和byte
類型的變量被提到前面進行前置補位,并在long
類型前進行了1字節(jié)的對齊填充。
4.2 擁有父類情況
- 當一個類擁有父類時,整體遵循在父類中定義的變量出現(xiàn)在子類中定義的變量之前的原則
public class A {
int i1,i2;
long l1,l2;
char c1,c2;
}
public class B extends A{
boolean b1;
double d1,d2;
}
查看內(nèi)存結(jié)構(gòu):
- 如果父類需要后置補位的情況,可能會將子類中類型長度較短的變量提前,但是整體還是遵循子類在父類之后的原則
public class A {
int i1,i2;
long l1;
}
public class B extends A {
int i1,i2;
long l1;
}
查看內(nèi)存結(jié)構(gòu):
可以看到,子類中較短長度的變量被提前到父類后進行了后置補位。
- 父類的前置對齊填充會被子類繼承
public class A {
long l;
}
public class B extends A{
long l2;
int i1;
}
查看內(nèi)存結(jié)構(gòu):
當B類沒有繼承A類時,正好滿足8字節(jié)對齊,不需要進行對齊填充。當B類繼承A類后,會繼承A類的前置補位填充,因此在B類的末尾也需要對齊填充。
4.3 引用數(shù)據(jù)類型
在上面的例子中,僅探討了基本數(shù)據(jù)類型的排序情況,那么如果存在引用數(shù)據(jù)類型時,排序情況是怎樣的呢?在User
類中添加引用類型:
public class User {
int id;
String firstName;
String lastName;
int age;
}
查看內(nèi)存布局:
可以看到默認情況下,基本數(shù)據(jù)類型的變量排在引用數(shù)據(jù)類型前。這個順序可以在jvm
啟動參數(shù)中進行修改:
-XX:FieldsAllocationStyle=0
重新運行,可以看到引用數(shù)據(jù)類型的排列順序被放在了前面:
對FieldsAllocationStyle
的不同取值簡要說明:
- 0:先放入普通對象的引用指針,再放入基本數(shù)據(jù)類型變量
- 1:默認情況,表示先放入基本數(shù)據(jù)類型變量,再放入普通對象的引用指針
4.4 靜態(tài)變量
在上面的基礎(chǔ)上,在類中加入靜態(tài)變量:
public class User {
int id;
static byte local;
}
查看內(nèi)存布局:
通過結(jié)果可以看到,靜態(tài)變量并不在對象的內(nèi)存布局中,它的大小是不計算在對象中的,因為靜態(tài)變量屬于類而不是屬于某一個對象的。
5、對齊填充字節(jié)
在Hotspot
的自動內(nèi)存管理系統(tǒng)中,要求對象的起始地址必須是8字節(jié)的整數(shù)倍,也就是說對象的大小必須滿足8字節(jié)的整數(shù)倍。因此如果實例數(shù)據(jù)沒有對齊,那么需要進行對齊補全空缺,補全的bit
位僅起占位符作用,不具有特殊含義。
在前面的例子中,我們已經(jīng)對對齊填充有了充分的認識,下面再做一些補充:
- 在開啟指針壓縮的情況下,如果類中有
long/double
類型的變量時,會在對象頭和實例數(shù)據(jù)間形成間隙(gap
),為了節(jié)省空間,會默認把較短長度的變量放在前邊,這一功能可以通過jvm參數(shù)進行開啟或關(guān)閉:
# 開啟
-XX:+CompactFields
# 關(guān)閉
-XX:-CompactFields
測試關(guān)閉情況,可以看到較短長度的變量沒有前移填充:
- 在前面指針壓縮中,我們提到了可以改變對齊寬度,這也是通過修改下面的jvm參數(shù)配置實現(xiàn)的:
-XX:ObjectAlignmentInBytes
默認情況下對齊寬度為8,這個值可以修改為2~256以內(nèi)2的整數(shù)冪,一般情況下都以8字節(jié)對齊或16字節(jié)對齊。測試修改為16字節(jié)對齊:
上面的例子中,在調(diào)整為16字節(jié)對齊的情況下,最后一行的屬性字段只占了6字節(jié),因此會添加10字節(jié)進行對齊填充。當然普通情況下不建議修改對齊長度參數(shù),如果對齊寬度過長,可能會導致內(nèi)存空間的浪費。
6、總結(jié)
本文通過使用jol
對java對象的結(jié)構(gòu)進行調(diào)試,學習了對象內(nèi)存布局的基本知識。通過學習,能夠幫助我們:
- 掌握對象內(nèi)存布局,基于此基礎(chǔ)進行jvm參數(shù)調(diào)優(yōu)
- 了解對象頭在
synchronize
的鎖升級過程中的作用 - 熟悉 jvm 中對象的尋址過程
- 通過計算對象大小,可以在評估業(yè)務(wù)量的基礎(chǔ)上在項目上線前預(yù)估需要使用多少內(nèi)存,防止服務(wù)器頻繁 gc
來源:公眾號 碼農(nóng)參上 作者:Dr Hydra