iOS - 老生常談內存管理(六):Tagged Pointer

objc4源碼中,咱們常常會在函數中看到Tagged PointerTagged Pointer到底是何方神聖?請開始閱讀本文。安全

1. Tagged Pointer 是什麼?

如下是蘋果在 WWDC2013 《Session 404 Advances in Objective-C》中對Tagged Pointer的介紹:
【視頻連接:developer.apple.com/videos/play…Tagged Pointer部分從 36:50 左右開始】併發

爲了節省內存和提升執行效率,蘋果在64bit程序中引入了Tagged Pointer技術,用於優化NSNumberNSDateNSString等小對象的存儲。app

在引入 Tagged Pointer 技術以前

NSNumber等對象存儲在堆上,NSNumber的指針中存儲的是堆中NSNumber對象的地址值。異步

從內存佔用來看

基本數據類型所需的內存不大。好比NSInteger變量,它所佔用的內存是與 CPU 的位數有關,以下。在 32 bit 下佔用 4 個字節,而在 64 bit 下佔用 8 個字節。指針類型的大小一般也是與 CPU 位數相關,一個指針所在 32 bit 下佔用 4 個字節,在 64 bit 下佔用 8 個字節。async

#if __LP64__ || 0 || NS_BUILD_32_LIKE_64
typedef long NSInteger;
typedef unsigned long NSUInteger;
#else
typedef int NSInteger;
typedef unsigned int NSUInteger;
#endif
複製代碼

假設咱們經過NSNumber對象存儲一個NSInteger的值,系統實際上會給咱們分配多少內存呢? 因爲Tagged Pointer沒法禁用,因此如下將變量i設了一個很大的數,以讓NSNumber對象存儲在堆上。ide

備註: 能夠經過設置環境變量OBJC_DISABLE_TAGGED_POINTERSYES來禁用Tagged Pointer,但若是你這麼作,運行就Crash函數

objc[39337]: tagged pointers are disabled
(lldb) 
複製代碼

由於Runtime在程序運行時會判斷Tagged Pointer是否被禁用,若是是的話就會調用_objc_fatal()函數殺死進程。因此,雖然蘋果提供了OBJC_DISABLE_TAGGED_POINTERS這個環境變量給咱們,可是Tagged Pointer仍是沒法禁用。性能

NSInteger i = 0xFFFFFFFFFFFFFF;
    NSNumber *number = [NSNumber numberWithInteger:i];
    NSLog(@"%zd", malloc_size((__bridge const void *)(number))); // 32
    NSLog(@"%zd", sizeof(number)); // 8
複製代碼

因爲NSNumber繼承自NSObject,全部它有isa指針,加上內存對齊的處理,系統給NSNumber對象分配了 32 個字節內存。經過 LLDB 指令讀取它的內存,實際上它並無用完 32 個字節。優化

從以上能夠得知,在 64 bit 下,若是沒有使用 Tagged Pointer的話,爲了使用一個 NSNumber對象就須要 8 個字節指針內存和 32 個字節對象內存。而直接使用一個 NSInteger變量只要 8 個字節內存,相差好幾倍。但總不能棄用 NSNumber對象而改用基本數據類型吧。

從效率上來看

爲了使用一個NSNumber對象,須要在堆上爲其分配內存,還要維護它的引用計數,管理它的生命週期,實在是影響執行效率。ui

在引入 Tagged Pointer 技術以後

NSNumber等對象的值直接存儲在了指針中,沒必要在堆上爲其分配內存,節省了不少內存開銷。在性能上,有着 3 倍空間效率的提高以及 106 倍建立和銷燬速度的提高。

NSNumber等對象的指針中存儲的數據變成了Tag+Data形式(Tag爲特殊標記,用於區分NSNumberNSDateNSString等對象類型;Data爲對象的值)。這樣使用一個NSNumber對象只須要 8 個字節指針內存。當指針的 8 個字節不夠存儲數據時,纔會在將對象存儲在堆上。

咱們再來看一下若是使用了Tagged Pointer,系統會給NSNumber對象分配多少內存。

NSInteger i = 1;
     NSNumber *number = [NSNumber numberWithInteger:i];
     NSLog(@"%zd", malloc_size((__bridge const void *)(number))); // 0
     NSLog(@"%zd", sizeof(number)); // 8
複製代碼

可見,使用了Tagged PointerNSNumber對象的值直接存儲在了指針上,不會在堆上申請內存。則使用一個NSNumber對象只須要指針的 8 個字節內存就夠了,大大的節省了內存佔用。

2. Tagged Pointer 的原理

2.1 關閉 Tagged Pointer 的數據混淆

在如今的版本中,爲了保證數據安全,蘋果對 Tagged Pointer 作了數據混淆,開發者經過打印指針沒法判斷它是否是一個Tagged Pointer,更沒法讀取Tagged Pointer的存儲數據。

因此在分析Tagged Pointer以前,咱們須要先關閉Tagged Pointer的數據混淆,以方便咱們調試程序。經過設置環境變量OBJC_DISABLE_TAG_OBFUSCATIONYES

2.2 MacOS 分析

NSNumber

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSNumber *number1 = @1;
        NSNumber *number2 = @2;
        NSNumber *number3 = @3;
        NSNumber *number4 = @(0xFFFFFFFFFFFFFFFF);
    
        NSLog(@"%p %p %p %p", number1, number2, number3, number4);
    }
    return 0;
}
// 關閉 Tagged Pointer 數據混淆後:0x127 0x227 0x327 0x600003a090e0
// 關閉 Tagged Pointer 數據混淆前:0xaca2838a63a4fb34 0xaca2838a63a4fb04 0xaca2838a63a4fb14 0x600003a090e0
複製代碼

從以上打印結果能夠看出,number1~number3指針爲Tagged Pointer類型,能夠看到對象的值都存儲在了指針中,對應0x10x20x3。而number4因爲數據過大,指針的8個字節不夠存儲,因此在堆中分配了內存。

注意: MacOSiOS平臺下的Tagged Pointer有差異,下面會講到。

0x127 中的 2 和 7 表示什麼?

咱們先來看這個70x127爲十六進制表示,7的二進制爲0111。 最後一位1Tagged Pointer標識位,表明這個指針是Tagged Pointer。 前面的011是類標識位,對應十進制爲3,表示NSNumber類。

備註: MacOS下采用 LSB(Least Significant Bit,即最低有效位)爲Tagged Pointer標識位,而iOS下則採用 MSB(Most Significant Bit,即最高有效位)爲Tagged Pointer標識位。

能夠在Runtime源碼objc4中查看NSNumberNSDateNSString等類的標識位。

// objc-internal.h
{
    OBJC_TAG_NSAtom            = 0, 
    OBJC_TAG_1                 = 1, 
    OBJC_TAG_NSString          = 2, 
    OBJC_TAG_NSNumber          = 3, 
    OBJC_TAG_NSIndexPath       = 4, 
    OBJC_TAG_NSManagedObjectID = 5, 
    OBJC_TAG_NSDate            = 6,
    ......
}
複製代碼

代碼驗證:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSNumber *number = @1;
        NSString *string = [NSString stringWithFormat:@"a"];
    
        NSLog(@"%p %p", number, string);
    }
    return 0;
}
// 0x127 0x6115
複製代碼

以上打印的string指針值爲0x611561a的 ASCII 碼,最後一位5的二進制爲0101,其中最後一位1是表明這個指針是Tagged Pointer前面已經說過,010對應十進制爲2,表示NSString類。

0x127 中的 2(即倒數第二位)又表明什麼呢?

倒數第二位用來表示數據類型。

示例:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        char a = 1;
        short b = 1;
        int c = 1;
        long d = 1;
        float e = 1.0;
        double f = 1.00;
        
        NSNumber *number1 = @(a);
        NSNumber *number2 = @(b);
        NSNumber *number3 = @(c);
        NSNumber *number4 = @(d);
        NSNumber *number5 = @(e);
        NSNumber *number6 = @(f);

        NSLog(@"%p %p %p %p %p %p", number1, number2, number3, number4, number5, number6);
    }
    return 0;
}
// 0x107 0x117 0x127 0x137 0x147 0x157
複製代碼

Tagged Pointer倒數第二位對應數據類型:

Tagged Pointer 倒數第二位 對應數據類型
0 char
1 short
2 int
3 long
4 float
5 double

下圖是MacOSNSNumberTagged Pointer位視圖:

Tagged Pointer 位視圖

NSString

接下來咱們來分析一下Tagged PointerNSString中的應用。同NSNumber同樣,在64 bitMacOS下,若是一個NSString對象指針爲Tagged Pointer,那麼它的後 4 位(0-3)做爲標識位,第 4-7 位表示字符串長度,剩餘的 56 位就能夠用來存儲字符串。

示例:

// MRC 環境
#define HTLog(_var) \
{ \
    NSString *name = @#_var; \
    NSLog(@"%@: %p, %@, %lu", name, _var, [_var class], [_var retainCount]); \
}

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSString *a = @"a";
        NSMutableString *b = [a mutableCopy];
        NSString *c = [a copy];
        NSString *d = [[a mutableCopy] copy];
        NSString *e = [NSString stringWithString:a];
        NSString *f = [NSString stringWithFormat:@"f"];
        NSString *string1 = [NSString stringWithFormat:@"abcdefg"];
        NSString *string2 = [NSString stringWithFormat:@"abcdefghi"];
        NSString *string3 = [NSString stringWithFormat:@"abcdefghij"];
        HTLog(a);
        HTLog(b);
        HTLog(c);
        HTLog(d);
        HTLog(e);
        HTLog(f);
        HTLog(string1);
        HTLog(string2);
        HTLog(string3);
    }
    return 0;
}
/* a: 0x100002038, __NSCFConstantString, 18446744073709551615 b: 0x10071f3c0, __NSCFString, 1 c: 0x100002038, __NSCFConstantString, 18446744073709551615 d: 0x6115, NSTaggedPointerString, 18446744073709551615 e: 0x100002038, __NSCFConstantString, 18446744073709551615 f: 0x6615, NSTaggedPointerString, 18446744073709551615 string1: 0x6766656463626175, NSTaggedPointerString, 18446744073709551615 string2: 0x880e28045a54195, NSTaggedPointerString, 18446744073709551615 string3: 0x10071f6d0, __NSCFString, 1 */
複製代碼

從打印結果來看,有三種NSString類型:

類型 描述
__NSCFConstantString 1. 常量字符串,存儲在字符串常量區,繼承於 __NSCFString。相同內容的 __NSCFConstantString 對象的地址相同,也就是說常量字符串對象是一種單例,能夠經過 == 判斷字符串內容是否相同。
2. 這種對象通常經過字面值@"..."建立。若是使用 __NSCFConstantString 來初始化一個字符串,那麼這個字符串也是相同的 __NSCFConstantString。
__NSCFString 1. 存儲在堆區,須要維護其引用計數,繼承於 NSMutableString。
2. 經過stringWithFormat:等方法建立的NSString對象(且字符串值過大沒法使用Tagged Pointer存儲)通常都是這種類型。
NSTaggedPointerString Tagged Pointer,字符串的值直接存儲在了指針上。

打印結果分析:

NSString 對象 類型 分析
a __NSCFConstantString 經過字面量@"..."建立
b __NSCFString a 的深拷貝,指向不一樣的內存地址,被拷貝到堆區
c __NSCFConstantString a 的淺拷貝,指向同一塊內存地址
d NSTaggedPointerString 單獨對 a 進行 copy(如 c),淺拷貝是指向同一塊內存地址,因此不會產生Tagged Pointer;單獨對 a 進行 mutableCopy(如 b),複製出來是可變對象,內容大小能夠擴展;而Tagged Pointer存儲的內容大小有限,所以沒法知足可變對象的存儲要求。
e __NSCFConstantString 使用 __NSCFConstantString 來初始化的字符串
f NSTaggedPointerString 經過stringWithFormat:方法建立,指針足夠存儲字符串的值。
string1 NSTaggedPointerString 經過stringWithFormat:方法建立,指針足夠存儲字符串的值。
string2 NSTaggedPointerString 經過stringWithFormat:方法建立,指針足夠存儲字符串的值。
string3 __NSCFString 經過stringWithFormat:方法建立,指針不足夠存儲字符串的值。

能夠看到,爲Tagged Pointer的有dfstring1string2指針。它們的指針值分別爲 0x61150x66150x67666564636261750x880e28045a54195

其中0x610x660x67666564636261分別對應字符串的 ASCII 碼。

最後一位5的二進制爲0101,最後一位1是表明這個指針是Tagged Pointer010對應十進制爲2,表示NSString類。

倒數第二位1179表明字符串長度。

對於string2的指針值0x880e28045a54195,雖然從指針中看不出來字符串的值,但其也是一個Tagged Pointer

下圖是MacOSNSStringTagged Pointer位視圖:

Tagged Pointer 位視圖

2.3 iOS 分析

NSNumber

- (void)viewDidLoad {
    [super viewDidLoad];
               
    NSNumber *number1 = @1;
    NSNumber *number2 = @2;
    NSNumber *number3 = @79;
    NSNumber *number4 = @(0xFFFFFFFFFFFFFFFF);
    
    NSLog(@"%p %p %p %p", number1, number2, number3, number4);   
}
// 0xb000000000000012 0xb000000000000022 0xb0000000000004f2 0x600000678480
複製代碼

從以上打印結果能夠看出,number1~number3指針爲Tagged Pointer類型,能夠看到對象的值都存儲在了指針中,對應倒數第二位開始的124f。而number4因爲數據過大,指針的8個字節不夠存儲,因此在堆中分配了內存。

最後一位用來表示數據類型。

第一位b的二進制爲1011,其中第一位1Tagged Pointer標識位。後面的011是類標識位,對應十進制爲3,表示NSNumber類。

下圖是iOSNSNumberTagged Pointer位視圖:

Tagged Pointer 位視圖

NSString

同理,再也不分析。

下圖是iOSNSStringTagged Pointer位視圖:

Tagged Pointer 位視圖

3. 如何判斷 Tagged Pointer ?

前面已經說過了,經過Tagged Pointer標識位。

objc4源碼中找到判斷Tagged Pointer的函數:

// objc-internal.h
static inline bool 
_objc_isTaggedPointer(const void * _Nullable ptr)
{
    return ((uintptr_t)ptr & _OBJC_TAG_MASK) == _OBJC_TAG_MASK;
}
複製代碼

能夠看到,它是將指針值與一個_OBJC_TAG_MASK掩碼進行按位與運算,查看該掩碼:

#if (TARGET_OS_OSX || TARGET_OS_IOSMAC) && __x86_64__
    // 64-bit Mac - tag bit is LSB
# define OBJC_MSB_TAGGED_POINTERS 0 // MacOS
#else
    // Everything else - tag bit is MSB
# define OBJC_MSB_TAGGED_POINTERS 1 // iOS
#endif

#define _OBJC_TAG_INDEX_MASK 0x7
// array slot includes the tag bit itself
#define _OBJC_TAG_SLOT_COUNT 16
#define _OBJC_TAG_SLOT_MASK 0xf

#define _OBJC_TAG_EXT_INDEX_MASK 0xff
// array slot has no extra bits
#define _OBJC_TAG_EXT_SLOT_COUNT 256
#define _OBJC_TAG_EXT_SLOT_MASK 0xff

#if OBJC_MSB_TAGGED_POINTERS
# define _OBJC_TAG_MASK (1UL<<63) // _OBJC_TAG_MASK # define _OBJC_TAG_INDEX_SHIFT 60 # define _OBJC_TAG_SLOT_SHIFT 60 # define _OBJC_TAG_PAYLOAD_LSHIFT 4 # define _OBJC_TAG_PAYLOAD_RSHIFT 4 # define _OBJC_TAG_EXT_MASK (0xfUL<<60) # define _OBJC_TAG_EXT_INDEX_SHIFT 52 # define _OBJC_TAG_EXT_SLOT_SHIFT 52 # define _OBJC_TAG_EXT_PAYLOAD_LSHIFT 12 # define _OBJC_TAG_EXT_PAYLOAD_RSHIFT 12 #else # define _OBJC_TAG_MASK 1UL // _OBJC_TAG_MASK # define _OBJC_TAG_INDEX_SHIFT 1 # define _OBJC_TAG_SLOT_SHIFT 0 # define _OBJC_TAG_PAYLOAD_LSHIFT 0 # define _OBJC_TAG_PAYLOAD_RSHIFT 4 # define _OBJC_TAG_EXT_MASK 0xfUL # define _OBJC_TAG_EXT_INDEX_SHIFT 4 # define _OBJC_TAG_EXT_SLOT_SHIFT 4 # define _OBJC_TAG_EXT_PAYLOAD_LSHIFT 0 # define _OBJC_TAG_EXT_PAYLOAD_RSHIFT 12 #endif 複製代碼

由此咱們能夠驗證:

  • MacOS下采用 LSB(Least Significant Bit,即最低有效位)爲Tagged Pointer標識位;
  • iOS下則採用 MSB(Most Significant Bit,即最高有效位)爲Tagged Pointer標識位。

而存儲在堆空間的對象因爲內存對齊,它的內存地址的最低有效位爲 0。由此能夠辨別Tagged Pointer和通常對象指針。

objc4源碼中,咱們常常會在函數中看到Tagged Pointer。好比objc_msgSend函數:

ENTRY _objc_msgSend
	UNWIND _objc_msgSend, NoFrame

	cmp	p0, #0 // nil check and tagged pointer check
#if SUPPORT_TAGGED_POINTERS
	b.le	LNilOrTagged		// (MSB tagged pointer looks negative)
#else
	b.eq	LReturnZero
#endif
	ldr	p13, [x0]		// p13 = isa
	GetClassFromIsa_p16 p13		// p16 = class
LGetIsaDone:
	// calls imp or objc_msgSend_uncached
	CacheLookup NORMAL, _objc_msgSend

#if SUPPORT_TAGGED_POINTERS
LNilOrTagged:
	b.eq	LReturnZero		// nil check

	// tagged
	adrp	x10, _objc_debug_taggedpointer_classes@PAGE
	add	x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
	ubfx	x11, x0, #60, #4
	ldr	x16, [x10, x11, LSL #3]
	adrp	x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
	add	x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
	cmp	x10, x16
	b.ne	LGetIsaDone

	// ext tagged
	adrp	x10, _objc_debug_taggedpointer_ext_classes@PAGE
	add	x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
	ubfx	x11, x0, #52, #8
	ldr	x16, [x10, x11, LSL #3]
	b	LGetIsaDone
// SUPPORT_TAGGED_POINTERS
#endif
複製代碼

objc_msgSend能識別Tagged Pointer,好比NSNumberintValue方法,直接從指針提取數據,不會進行objc_msgSend的三大流程,節省了調用開銷。

內存管理相關的,如retain方法中調用的rootRetain

ALWAYS_INLINE id 
objc_object::rootRetain(bool tryRetain, bool handleOverflow)
{
    // 若是是 tagged pointer,直接返回 this
    if (isTaggedPointer()) return (id)this; 

    bool sideTableLocked = false;
    bool transcribeToSideTable = false; 

    isa_t oldisa;
    isa_t newisa;
    ......
複製代碼

來看一下isTaggedPointer()函數實現:

inline bool 
objc_object::isTaggedPointer() 
{
    return _objc_isTaggedPointer(this);
}
複製代碼

該函數就是調用了_objc_isTaggedPointer

4. Tagged Pointer 注意點

咱們知道,全部OC對象都有isa指針,而Tagged Pointer並非真正的對象,它沒有isa指針,因此若是你直接訪問Tagged Pointerisa成員的話,在編譯時將會有以下警告:

對於Tagged Pointer,應該換成相應的方法調用,如isKindOfClassobject_getClass。只要避免在代碼中直接訪問Tagged Pointerisa,便可避免這個問題。

固然如今也不容許咱們在代碼中直接訪問對象的isa了,不然編譯不經過。

咱們經過 LLDB 打印Tagged Pointerisa,會提示以下錯誤:

而打印OC對象的isa沒有問題:

相關題目

Q:執行如下兩段代碼,有什麼區別?

dispatch_queue_t queue = dispatch_get_global_queue(0, 0);
    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            self.name = [NSString stringWithFormat:@"abcdefghij"];
        });
    }
複製代碼
dispatch_queue_t queue = dispatch_get_global_queue(0, 0);
    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            self.name = [NSString stringWithFormat:@"abcdefghi"];
        });
    }
複製代碼

內心一萬個草泥馬🦙奔騰而過~~~,兩段代碼差異不就是字符串長度少了一位嗎,哪有什麼差異?

結果一運行,哎呀?第一段代碼竟然Crash,而第二段卻沒有問題,奇了怪了。 分別打印兩段代碼的self.name類型看看,原來第一段代碼中self.name__NSCFString類型,而第二段代碼中爲NSTaggedPointerString類型。

咱們來看一下第一段代碼Crash的地方:

想必你已經猜到了,__NSCFString存儲在堆上,它是個正常對象,須要維護引用計數的。self.name經過setter方法爲其賦值。而setter方法的實現以下:

- (void)setName:(NSString *)name {
    if(_name != name) {
        [_name release];
        _name = [name retain]; // or [name copy]
    }
}
複製代碼

咱們異步併發執行setter方法,可能就會有多條線程同時執行[_name release],連續release兩次就會形成對象的過分釋放,致使Crash

解決辦法:

    1. 使用atomic屬性關鍵字。
    1. 加鎖
dispatch_queue_t queue = dispatch_get_global_queue(0, 0);
    for (int i = 0; i < 1000; i++) {
        dispatch_async(queue, ^{
            // 加鎖
            self.name = [NSString stringWithFormat:@"abcdefghij"];
            // 解鎖
        });
    }
複製代碼

而第二段代碼中爲NSTaggedPointerString類型,就意味着它不會去調用setter方法,而是直接將Tagged Pointer指針的值賦值給成員變量,因此能夠正常運行。

相關文章
相關標籤/搜索