用kzalloc申請內存的時候, 效果等同於先是用 kmalloc() 申請空間 , 而後用 memset() 來初始化 ,全部申請的元素都被初始化爲 0.node
-
-
-
-
-
- static inline void *kzalloc(size_t size, gfp_t flags)
- {
- return kmalloc(size, flags | __GFP_ZERO);
- }
kzalloc 函數是帶參數調用kmalloc函數,添加的參數是或了標誌位__GFP_ZERO,
- void *__kmalloc(size_t size, gfp_t flags)
- {
- struct kmem_cache *s;
- void *ret;
-
- if (unlikely(size > SLUB_MAX_SIZE))
- return kmalloc_large(size, flags);
-
- s = get_slab(size, flags);
-
- if (unlikely(ZERO_OR_NULL_PTR(s)))
- return s;
-
- ret = slab_alloc(s, flags, -1, _RET_IP_);
-
- trace_kmalloc(_RET_IP_, ret, size, s->size, flags);
-
- return ret;
- }
這個函數調用trace_kmalloc,flags參數不變,繼續往裏面能夠看到
- static __always_inline void *slab_alloc(struct kmem_cache *s,
- gfp_t gfpflags, int node, unsigned long addr)
- {
- void **object;
- struct kmem_cache_cpu *c;
- unsigned long flags;
- unsigned int objsize;
-
- gfpflags &= gfp_allowed_mask;
-
- lockdep_trace_alloc(gfpflags);
- might_sleep_if(gfpflags & __GFP_WAIT);
-
- if (should_failslab(s->objsize, gfpflags))
- return NULL;
-
- local_irq_save(flags);
- c = get_cpu_slab(s, smp_processor_id());
- objsize = c->objsize;
- if (unlikely(!c->freelist || !node_match(c, node)))
-
- object = __slab_alloc(s, gfpflags, node, addr, c);
-
- else {
- object = c->freelist;
- c->freelist = object[c->offset];
- stat(c, ALLOC_FASTPATH);
- }
- local_irq_restore(flags);
-
- if (unlikely((gfpflags & __GFP_ZERO) && object))
- memset(object, 0, objsize);
-
- kmemcheck_slab_alloc(s, gfpflags, object, c->objsize);
- kmemleak_alloc_recursive(object, objsize, 1, s->flags, gfpflags);
-
- return object;
- }
這裏主要判斷兩個標誌,WAIT和ZERO,和本文有關的關鍵代碼就是
if (unlikely((gfpflags & __GFP_ZERO) && object))
memset(object, 0, objsize);linux
到此,這個函數區別於kmalloc的地方就清楚了
數組
kmalloc 函數詳解緩存
#include <linux/slab.h> void *kmalloc(size_t size, int flags);ide
給 kmalloc 的第一個參數是要分配的塊的大小. 第 2 個參數, 分配標誌, 很是有趣, 由於它以幾個方式控制 kmalloc 的行爲.
最通常使用的標誌, GFP_KERNEL, 意思是這個分配((內部最終經過調用 __get_free_pages 來進行, 它是 GFP_ 前綴的來源) 表明運行在內核空間的進程而進行的. 換句話說, 這意味着調用函數是表明一個進程在執行一個系統調用. 使用 GFP_KENRL 意味着 kmalloc 可以使當前進程在少內存的狀況下睡眠來等待一頁. 一個使用 GFP_KERNEL 來分配內存的函數必須, 所以, 是可重入的而且不能在原子上下文中運行. 噹噹前進程睡眠, 內核採起正確的動做來定位一些空閒內存, 或者經過刷新緩存到磁盤或者交換出去一個用戶進程的內存.
GFP_KERNEL 不一直是使用的正確分配標誌; 有時 kmalloc 從一個進程的上下文的外部調用. 例如, 這類的調用可能發生在中斷處理, tasklet, 和內核定時器中. 在這個狀況下, 當前進程不該當被置爲睡眠, 而且驅動應當使用一個 GFP_ATOMIC 標誌來代替. 內核正常地試圖保持一些空閒頁以便來知足原子的分配. 當使用 GFP_ATOMIC 時, kmalloc 可以使用甚至最後一個空閒頁. 若是這最後一個空閒頁不存在, 可是, 分配失敗.
其餘用來代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的標誌, 儘管它們 2 個涵蓋大部分設備驅動的須要. 全部的標誌定義在 <linux/gfp.h>, 而且每一個標誌用一個雙下劃線作前綴, 例如 __GFP_DMA. 另外, 有符號表明經常使用的標誌組合; 這些缺少前綴而且有時被稱爲分配優先級. 後者包括:
-
GFP_ATOMIC
-
用來從中斷處理和進程上下文以外的其餘代碼中分配內存. 從不睡眠.
-
GFP_KERNEL
-
內核內存的正常分配. 可能睡眠.
-
GFP_USER
-
用來爲用戶空間頁來分配內存; 它可能睡眠.
-
GFP_HIGHUSER
-
如同 GFP_USER, 可是從高端內存分配, 若是有. 高端內存在下一個子節描述.
-
GFP_NOIO
-
-
GFP_NOFS
-
這個標誌功能如同 GFP_KERNEL, 可是它們增長限制到內核能作的來知足請求. 一個 GFP_NOFS 分配不容許進行任何文件系統調用, 而 GFP_NOIO 根本不容許任何 I/O 初始化. 它們主要地用在文件系統和虛擬內存代碼, 那裏容許一個分配睡眠, 可是遞歸的文件系統調用會是一個壞注意.
上面列出的這些分配標誌能夠是下列標誌的相或來做爲參數, 這些標誌改變這些分配如何進行:
-
__GFP_DMA
-
這個標誌要求分配在可以 DMA 的內存區. 確切的含義是平臺依賴的而且在下面章節來解釋.
-
__GFP_HIGHMEM
-
這個標誌指示分配的內存能夠位於高端內存.
-
__GFP_COLD
-
正常地, 內存分配器盡力返回"緩衝熱"的頁 -- 可能在處理器緩衝中找到的頁. 相反, 這個標誌請求一個"冷"頁, 它在一段時間沒被使用. 它對分配頁做 DMA 讀是有用的, 此時在處理器緩衝中出現是無用的.
-
__GFP_NOWARN
-
這個不多用到的標誌阻止內核來發出警告(使用 printk ), 當一個分配沒法知足.
-
__GFP_HIGH
-
這個標誌標識了一個高優先級請求, 它被容許來消耗甚至被內核保留給緊急情況的最後的內存頁.
-
__GFP_REPEAT
-
-
__GFP_NOFAIL
-
-
__GFP_NORETRY
-
這些標誌修改分配器如何動做, 當它有困難知足一個分配. __GFP_REPEAT 意思是" 更盡力些嘗試" 經過重複嘗試 -- 可是分配可能仍然失敗. __GFP_NOFAIL 標誌告訴分配器不要失敗; 它盡最大努力來知足要求. 使用 __GFP_NOFAIL 是強烈不推薦的; 可能從不會有有效的理由在一個設備驅動中使用它. 最後, __GFP_NORETRY 告知分配器當即放棄若是得不到請求的內存.
-
kmalloc 可以分配的內存塊的大小有一個上限. 這個限制隨着體系和內核配置選項而變化. 若是你的代碼是要徹底可移植, 它不能期望能夠分配任何大於 128 KB. 若是你須要多於幾個 KB
-
這方面的緣由:
-
kmalloc並不直接從分頁機制中得到空閒頁面而是從slab頁面分配器那兒得到須要的頁面,slab的實現代碼限制了最大分配的大小爲128k,即 131072bytes,理論上你能夠經過更改slab.c中的 cache_sizes數組中的最大值使得kmalloc能夠得到更大的頁面數,不知道有沒有甚麼副效應或者沒有必要這樣作,由於獲取較大內存的方法有很 多,想必128k是經驗總結後的合適值。
-
alloc_page( )能夠分配的最大連續頁面是4K
-
static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order)
{
/*
* Gets optimized away by the compiler. */ if (order >= MAX_ORDER) return NULL; return _alloc_pages(gfp_mask, order); } alloc_pages最大分配頁面數爲512個,則可用內存數最大爲2^9*4K=2M