關於might_sleep的一點說明

這個函數我在看代碼時基本上是直接忽略的(由於我知道它實際上不幹什麼事),不過由於內核中不少函數一開始就會用一下它,爲了方便那些正在學習內核源碼的網友,本帖專門討論一下該函數到底被內核用來幹什麼。編程

簡單地說,若是沒有調試的需求(絕大多數下你日常跑的系統都是release版本的kernel),那麼這個宏(或者函數,稱謂並不重要)什麼實質性的活都不幹,內核只是用它來作一件事,就是提醒你,調用該函數的函數可能會sleep,這個跟其名字也是匹配的: The function calling might_sleep() might sleep。若是你想看源碼,我把它列在下面:函數

# define might_resched() do { } while (0)
# define might_sleep() do { might_resched(); } while (0)

看到沒,啥事都沒幹。其實內核源碼對此也有明確的註釋:might_sleep - annotation for functions that can sleep。因此對於release版的kernel image而言,might_sleep的做用僅僅是一個annotation,提醒使用者,一個使用might_sleep的函數在其後的代碼執行中可能會sleep。oop

不過若是有調試需求介入的話,好比你的系統莫名其妙地隨機性地crash掉,在通過一段艱難的案情分析排查以後,最後你決定打開內核的 CONFIG_DEBUG_ATOMIC_SLEEP選項,那麼此時might_sleep對案情的進一步推動就可能產生貢獻了。 CONFIG_DEBUG_ATOMIC_SLEEP選項主要用來排查是否在一個ATOMIC操做的上下文中有函數發生sleep行爲,關於什麼是 ATOMIC操做,內核源碼在might_sleep函數前也有一段註釋:學習

  • this macro will print a stack trace if it is executed in an atomic context (spinlock, irq-handler, ...)

因此很明顯,一個進程得到了spinlock以後它就進入了這裏所謂的atomic context,或者是在一個irq-handler,也就是一箇中斷上下文中。這兩種上下文中理論上不該該讓當前的execution path進入sleep狀態(雖然不是強制規定,換句話說,一個擁有spinlock的進程進入sleep並沒必要然意味着系統就必定會deadlock 等,可是對內核編程而言,仍是應該盡力避開這個雷區)。this

因此很明顯,一個進程得到了spinlock以後它就進入了這裏所謂的atomic context,或者是在一個irq-handler,也就是一箇中斷上下文中。這兩種上下文中理論上不該該讓當前的execution path進入sleep狀態(雖然不是強制規定,換句話說,一個擁有spinlock的進程進入sleep並沒必要然意味着系統就必定會deadlock 等,可是對內核編程而言,仍是應該盡力避開這個雷區)。atom

在CONFIG_DEBUG_ATOMIC_SLEEP選項打開的情形下,might_sleep又有哪些特殊的功能呢?先看看內核中的源碼:調試

void __might_sleep(const char *file, int line, int preempt_offset)
{
        static unsigned long prev_jiffy; /* ratelimiting */

        if ((preempt_count_equals(preempt_offset) && !irqs_disabled()) ||
            system_state != SYSTEM_RUNNING || oops_in_progress)
                return;
        if (time_before(jiffies, prev_jiffy + HZ) && prev_jiffy)
                return;
        prev_jiffy = jiffies;

        printk(KERN_ERR
                "BUG: sleeping function called from invalid context at %s:%d\n",
                        file, line);
        printk(KERN_ERR
                "in_atomic(): %d, irqs_disabled(): %d, pid: %d, name: %s\n",
                        in_atomic(), irqs_disabled(),
                        current->pid, current->comm);

        if (irqs_disabled())
                print_irqtrace_events(current);
        dump_stack();
}

上面的代碼我進行了輕微的刪減,去除了一些只有CONFIG_DEBUG_ATOMIC_SLEEP選項使能的情形下不幹活的函數。code

# define might_sleep() \
        do { __might_sleep(__FILE__, __LINE__, 0); might_resched(); } while (0)

在當前CONFIG_DEBUG_ATOMIC_SLEEP選項使能的前提下, 能夠看到__might_sleep仍是幹了很多事情的,最主要的工做是在第一個if語句那裏,尤爲是preempt_count_equals和 irqs_disabled,都是用來判斷當前的上下文是不是一個atomic context,由於咱們知道,只要進程得到了spin_lock的任一個變種形式的lock,那麼不管是單處理器系統仍是多處理器系統,都會致使 preempt_count發生變化,而irq_disabled則是用來判斷當前中斷是否開啓。__might_sleep正是根據這些信息來判斷當前正在執行的代碼上下文是不是個atomic,若是不是,那麼函數就直接返回了,由於一切正常。若是是,那麼代碼下行。進程

因此讓CONFIG_DEBUG_ATOMIC_SLEEP選項打開,能夠捕捉到在一個atomic context中是否發生了sleep,若是你的代碼不當心在某處的確出現了這種情形,那麼might_sleep會經過後續的printk以及dump_stack來協助你發現這種情形。源碼

至於__might_sleep函數中的system_state,它是一個全局性的enum型變量,主要用來記錄當前系統的狀態:

enum system_states system_state __read_mostly;
EXPORT_SYMBOL(system_state);

注意system_state已經被export出來,因此內核模塊能夠直接讀該值來判斷當前系統的運行狀態,常見的狀態包括:

extern enum system_states {
    SYSTEM_BOOTING,
    SYSTEM_RUNNING,
    SYSTEM_HALT,
    SYSTEM_POWER_OFF,
    SYSTEM_RESTART,
    SYSTEM_SUSPEND_DISK,
} system_state;

最多見的狀態固然是SYSTEM_RUNNING了,你的系統正常起來以後就處於這個狀態。由於跟當前的話題沒有直接的關聯,這裏只提一下好了。

相關文章
相關標籤/搜索