理解代碼的內存消耗,最關鍵是要知道本身所用編程語言的內存管理。node
不一樣語言的內存管理
不一樣的編程語言各自的內存管理方式。python
-
Java 依賴JVM來作內存管理,不瞭解jvm內存管理的機制,極可能會因一些錯誤的代碼寫法而致使內存泄漏或內存溢出程序員
-
Python內存管理是由私有堆空間管理的,全部的python對象和數據結構都存儲在私有堆空間中。程序員沒有訪問堆的權限,只有解釋器才能操做。github
例如Python萬物皆對象,而且將內存操做封裝的很好,因此python的基本數據類型所用的內存會要遠大於存放純數據類型所佔的內存,例如,咱們都知道存儲int型數據須要四個字節,可是使用Python 申請一個對象來存放數據的話,所用空間要遠大於四個字節。面試
C++的內存管理
以C++爲例來介紹一下編程語言的內存管理。編程
若是咱們寫C++的程序,就要知道棧和堆的概念,程序運行時所需的內存空間分爲 固定部分,和可變部分,以下:數據結構
固定部分的內存消耗 是不會隨着代碼運行產生變化的, 可變部分則是會產生變化的jvm
更具體一些,一個由C/C++編譯的程序佔用的內存分爲如下幾個部分:編程語言
-
棧區(Stack) :由編譯器自動分配釋放,存放函數的參數值,局部變量的值等,其操做方式相似於數據結構中的棧。
-
堆區(Heap) :通常由程序員分配釋放,若程序員不釋放,程序結束時可能由OS收回
-
未初始化數據區(Uninitialized Data):存放未初始化的全局變量和靜態變量
-
初始化數據區(Initialized Data):存放已經初始化的全局變量和靜態變量
-
程序代碼區(Text):存放函數體的二進制代碼
代碼區和數據區所佔空間都是固定的,並且佔用的空間很是小,那麼看運行時消耗的內存主要看可變部分。
在可變部分中,棧區間的數據在代碼塊執行結束以後,系統會自動回收,而堆區間數據是須要程序員本身回收,因此也就是形成內存泄漏的發源地。
而Java、Python的話則不須要程序員去考慮內存泄漏的問題,虛擬機都作了這些事情。
如何計算程序佔用多大內存
想要算出本身程序會佔用多少內存就必定要了解本身定義的數據類型的大小,以下:
注意圖中有兩個不同的地方,爲何64位的指針就佔用了8個字節,而32位的指針佔用4個字節呢?
1個字節佔8個比特,那麼4個字節就是32個比特,可存放數據的大小爲2^32,也就是4G空間的大小,即:能夠尋找4G空間大小的內存地址。
你們如今使用的計算機通常都是64位了,因此編譯器也都是64位的。
安裝64位的操做系統的計算機內存都已經超過了4G,也就是指針大小若是仍是4個字節的話,就已經不能尋址所有的內存地址,因此64位編譯器使用8個字節的指針才能尋找全部的內存地址。
注意2^64是一個很是巨大的數,對於尋找地址來講已經足夠用了。
內存對齊
再介紹一下內存管理中另外一個重要的知識點:內存對齊。
不要覺得只有C/C++纔會有內存對齊,只要能夠跨平臺的編程語言都須要作內存對齊,Java、Python都是同樣的。
並且這是面試中面試官很是喜歡問到的問題,就是:爲何會有內存對齊?
主要是兩個緣由
-
平臺緣由:不是全部的硬件平臺都能訪問任意內存地址上的任意數據,某些硬件平臺只能在某些地址處取某些特定類型的數據,不然拋出硬件異常。爲了同一個程序能夠在多平臺運行,須要內存對齊。
-
硬件緣由:通過內存對齊後,CPU訪問內存的速度大大提高。
能夠看一下這段C++代碼輸出的各個數據類型大小是多少?
struct node{ int num; char cha; }st; int main() { int a[100]; char b[100]; cout << sizeof(int) << endl; cout << sizeof(char) << endl; cout << sizeof(a) << endl; cout << sizeof(b) << endl; cout << sizeof(st) << endl; }
看一下和本身想的結果同樣麼, 咱們來逐一分析一下。
其輸出的結果依次爲:
4 1 400 100 8
此時會發現,和單純計算字節數的話是有一些偏差的。
這就是由於內存對齊的緣由。
來看一下內存對齊和非內存對齊這兩種狀況下產生的效果區別。
CPU 讀取內存不是一次讀取單個字節,而是一次性讀取一整個 CacheLine ,這個 CacheLine 的大小是 64 字節。爲了方便演示,咱們假設 CacheLine 的大小是 4 字節,要讀取的也是一個 4 字節的 int。
第一種就是內存對齊的狀況,如圖:
內存對齊
一字節的char佔用了四個字節,空了三個字節的內存地址,int數據從地址4開始。
此時,直接將地址4,5,6,7處的四個字節數據讀取到便可。
第二種是沒有內存對齊的狀況如圖:
非內存對齊
char型的數據和int型的數據挨在一塊兒,該int數據從地址1開始,那麼CPU想要讀這個數據的話來看看須要幾步操做:
-
由於CPU是四個字節四個字節來尋址,首先CPU讀取0,1,2,3處的四個字節數據
-
CPU讀取4,5,6,7處的四個字節數據
-
合併地址1,2,3,4處四個字節的數據纔是本次操做須要的int數據
此時一共須要兩次尋址,一次合併的操做。
你們可能會發現內存對齊豈不是浪費的內存資源麼?
是這樣的,但事實上,相對來講計算機內存資源通常都是充足的,咱們更但願的是提升運行速度。
編譯器通常都會作內存對齊的優化操做,也就是說當考慮程序真正佔用的內存大小的時候,也須要認識到內存對齊的影響。
總結
很多同窗對這方面的知識很欠缺,基本處於盲區,經過這一篇你們能夠初步補齊一下這塊。
以後也能夠有意識的去學習本身所用的編程語言是如何管理內存的,這些也是程序員的內功。