內核模塊的熱插拔事件的通知基於uevent機制。linux
當kobject的狀態發生改變(如,add, remove等)時,會通知用戶空間,用戶空間接收到事件通知後能夠作相應的處理。
uevent把事件上報給用戶空間的兩種途徑:
1.經過kmod模塊,直接調用用戶空間的可執行程序或腳本。
2.經過netlink通訊機制,將事件從內核空間傳遞到用戶空間。數組
linux-3.5/include/linux/kobject.h // ADD/REMOVE,Kobject(或上層數據結構)的添加/移除事件。 // ONLINE/OFFLINE,Kobject(或上層數據結構)的上線/下線事件,實際上是是否使能。 // CHANGE,Kobject(或上層數據結構)的狀態或者內容發生改變。 // MOVE,Kobject(或上層數據結構)更更名稱或者更改Parent(意味着在sysfs中更改了目錄結構)。 //CHANGE,若是設備驅動須要上報的事件再也不上面事件的範圍內,或者是自定義的事件,能夠使用該event,並攜帶相應的參數。 enum kobject_action { KOBJ_ADD, KOBJ_REMOVE, KOBJ_CHANGE, KOBJ_MOVE, KOBJ_ONLINE, KOBJ_OFFLINE, KOBJ_MAX }; #define UEVENT_HELPER_PATH_LEN 256 #define UEVENT_NUM_ENVP 32 /* number of env pointers */ #define UEVENT_BUFFER_SIZE 2048 /* buffer for the variables */ //在利用kmod模塊向用戶空間上報event事件時,會直接執行用戶空間的可執行文件。而在linux系統中,可執行文件的執行,依賴於環境變量, //所以kobj_uevent_env用於組織這次事件上報是的環境變量。 struct kobj_uevent_env { char *envp[UEVENT_NUM_ENVP];//指針數組,用於保存每一個環境變量的地址,最多支持32個環境變量 int envp_idx;//用戶訪問環境變量數組的索引 char buf[UEVENT_BUFFER_SIZE];//保存環境變量的buffer int buflen;//??? }; struct kset_uevent_ops { int (* const filter)(struct kset *kset, struct kobject *kobj);//當任何kobject須要上報uevent時,它所屬的kset能夠經過filter藉口過濾,阻止不但願上報的uevent。 const char *(* const name)(struct kset *kset, struct kobject *kobj);//該接口能夠返回kset的名稱。若是一個kset沒有合法的名稱,則其下的全部kobject將不容許上報uevent int (* const uevent)(struct kset *kset, struct kobject *kobj, struct kobj_uevent_env *env);//當任何kobject須要上報uevent時,它所屬的kset能夠經過該接口統一爲這些event添加環境變量。 //由於不少時候上報uevent時的環境變量都是相同的,所以能夠由kset統一處理,就不須要讓每一個Kobject獨自添加了。 };
#if defined(CONFIG_HOTPLUG) int kobject_uevent(struct kobject *kobj, enum kobject_action action); int kobject_uevent_env(struct kobject *kobj, enum kobject_action action, char *envp[]); __printf(2, 3) int add_uevent_var(struct kobj_uevent_env *env, const char *format, ...); int kobject_action_type(const char *buf, size_t count, enum kobject_action *type); kobject_uevent_env ,以 envp 爲環境變量,上報一個指定action的uevent。環境變量的做用是爲執行用戶空間程序指定運行環境。
int kobject_uevent(struct kobject *kobj, enum kobject_action action) { return kobject_uevent_env(kobj, action, NULL); } int kobject_uevent_env(struct kobject *kobj, enum kobject_action action, char *envp_ext[]) { struct kobj_uevent_env *env; const char *action_string = kobject_actions[action]; const char *devpath = NULL; const char *subsystem; struct kobject *top_kobj; struct kset *kset; const struct kset_uevent_ops *uevent_ops; int i = 0; int retval = 0; #ifdef CONFIG_NET struct uevent_sock *ue_sk; #endif pr_debug("kobject: '%s' (%p): %s\n", kobject_name(kobj), kobj, __func__); /* search the kset we belong to */ //1.查找當前kobject或其parent是否從屬於某個kset;若是都不從屬於某個kset,則返回錯誤。(說明一個kobject若沒有加入kset,是不會上報uevent的) top_kobj = kobj; while (!top_kobj->kset && top_kobj->parent) top_kobj = top_kobj->parent; if (!top_kobj->kset) { pr_debug("kobject: '%s' (%p): %s: attempted to send uevent " "without kset!\n", kobject_name(kobj), kobj, __func__); return -EINVAL; } kset = top_kobj->kset; uevent_ops = kset->uevent_ops; /* skip the event, if uevent_suppress is set*/ //2.查看kobj->uevent_suppress是否被設置;若是設置了,則忽略全部的uevent上報,並返回0. if (kobj->uevent_suppress) { pr_debug("kobject: '%s' (%p): %s: uevent_suppress " "caused the event to drop!\n", kobject_name(kobj), kobj, __func__); return 0; } /* skip the event, if the filter returns zero. */ //3.若是所屬的kset有uevent_ops->filter,則調用該函數,若該函數返回0,則過濾這次上報。(kset 能夠經過filter接口過濾不但願上報的event) if (uevent_ops && uevent_ops->filter) if (!uevent_ops->filter(kset, kobj)) { pr_debug("kobject: '%s' (%p): %s: filter function " "caused the event to drop!\n", kobject_name(kobj), kobj, __func__); return 0; } /* originating subsystem */ //4.判斷所屬的kset是否有合法的名稱,若uevent_ops->name存在就用其返回的名稱做爲subsystem;若uevent_ops->name不存在就用kset自己的kobject的名稱做爲subsystem; //若沒有合法的名稱,則不上報uevent if (uevent_ops && uevent_ops->name) subsystem = uevent_ops->name(kset, kobj); else subsystem = kobject_name(&kset->kobj); if (!subsystem) { pr_debug("kobject: '%s' (%p): %s: unset subsystem caused the " "event to drop!\n", kobject_name(kobj), kobj, __func__); return 0; } /* environment buffer */ //5.分配一個這次上報的用於保存環境變量的buffer, env = kzalloc(sizeof(struct kobj_uevent_env), GFP_KERNEL); if (!env) return -ENOMEM; /* complete object path */ //6.得到該kobject在sysfs中路徑 devpath = kobject_get_path(kobj, GFP_KERNEL); if (!devpath) { retval = -ENOENT; goto exit; } /* default keys */ //7.添加ACTION到env retval = add_uevent_var(env, "ACTION=%s", action_string); if (retval) goto exit; //8.添加DEVPATH(kobject路徑信息)到env retval = add_uevent_var(env, "DEVPATH=%s", devpath); if (retval) goto exit; //9.添加SUBSYSTEM到env retval = add_uevent_var(env, "SUBSYSTEM=%s", subsystem); if (retval) goto exit; /* keys passed in from the caller */ //10.若是傳入的envp_ext不空,則解析傳入的環境變量中,一樣調用add_uevent_var接口,添加到env指針中 if (envp_ext) { for (i = 0; envp_ext[i]; i++) { retval = add_uevent_var(env, "%s", envp_ext[i]); if (retval) goto exit; } } /* let the kset specific function add its stuff */ //11.若是 uevent_ops->uevent 存在,調用該接口,添加kset統一的環境變量到env指針 if (uevent_ops && uevent_ops->uevent) { retval = uevent_ops->uevent(kset, kobj, env); if (retval) { pr_debug("kobject: '%s' (%p): %s: uevent() returned " "%d\n", kobject_name(kobj), kobj, __func__, retval); goto exit; } } /* * Mark "add" and "remove" events in the object to ensure proper * events to userspace during automatic cleanup. If the object did * send an "add" event, "remove" will automatically generated by * the core, if not already done by the caller. */ //12.根據ACTION的類型,設置kobj->state_add_uevent_sent和kobj->state_remove_uevent_sent變量,以記錄正確的狀態 if (action == KOBJ_ADD) kobj->state_add_uevent_sent = 1; else if (action == KOBJ_REMOVE) kobj->state_remove_uevent_sent = 1; mutex_lock(&uevent_sock_mutex); /* we will send an event, so request a new sequence number */ //13.調用add_uevent_var接口,添加格式爲"SEQNUM=%llu」的序列號 retval = add_uevent_var(env, "SEQNUM=%llu", (unsigned long long)++uevent_seqnum); if (retval) { mutex_unlock(&uevent_sock_mutex); goto exit; } //14.若是定義了"CONFIG_NET」,則使用netlink發送該uevent #if defined(CONFIG_NET) /* send netlink message */ list_for_each_entry(ue_sk, &uevent_sock_list, list) { struct sock *uevent_sock = ue_sk->sk; struct sk_buff *skb; size_t len; if (!netlink_has_listeners(uevent_sock, 1)) continue; /* allocate message with the maximum possible size */ len = strlen(action_string) + strlen(devpath) + 2; skb = alloc_skb(len + env->buflen, GFP_KERNEL); if (skb) { char *scratch; /* add header */ scratch = skb_put(skb, len); sprintf(scratch, "%s@%s", action_string, devpath); /* copy keys to our continuous event payload buffer */ for (i = 0; i < env->envp_idx; i++) { len = strlen(env->envp[i]) + 1; scratch = skb_put(skb, len); strcpy(scratch, env->envp[i]); } NETLINK_CB(skb).dst_group = 1; retval = netlink_broadcast_filtered(uevent_sock, skb, 0, 1, GFP_KERNEL, kobj_bcast_filter, kobj); /* ENOBUFS should be handled in userspace */ if (retval == -ENOBUFS || retval == -ESRCH) retval = 0; } else retval = -ENOMEM; } #endif mutex_unlock(&uevent_sock_mutex); /* call uevent_helper, usually only enabled during early boot */ //15.以uevent_helper、 subsystem 以及添加了標準環境變量(HOME=/,PATH=/sbin:/bin:/usr/sbin:/usr/bin)的env指針爲參數, // 調用kmod模塊提供的call_usermodehelper函數,上報uevent。 if (uevent_helper[0] && !kobj_usermode_filter(kobj)) { char *argv [3]; argv [0] = uevent_helper;//在/sys/kernel/uevent_helper文件中能夠存入用戶空間可執行程序的路徑,當內核有事件發生時,將會執行該程序 argv [1] = (char *)subsystem; argv [2] = NULL; retval = add_uevent_var(env, "HOME=/"); if (retval) goto exit; retval = add_uevent_var(env, "PATH=/sbin:/bin:/usr/sbin:/usr/bin"); if (retval) goto exit; retval = call_usermodehelper(argv[0], argv, env->envp, UMH_WAIT_EXEC); } exit: kfree(devpath); kfree(env); return retval; }
uevent模塊經過kmod上報uevent時,會經過call_usermodehelper函數,調用用戶空間的可執行文件(或者腳本,簡稱uevent helper)處理該event。
而該uevent helper的路徑保存在uevent_helper數組中。 數據結構
能夠在編譯內核時,經過CONFIG_UEVENT_HELPER_PATH配置項,靜態指定uevent helper。
但這種方式會爲每一個event fork一個進程,隨着內核支持的設備數量的增多,這種方式在系統啓動時將會是致命的(能夠致使內存溢出等)。
所以只有在早期的內核版本中會使用這種方式,如今內核再也不推薦使用該方式。所以內核編譯時,須要把該配置項留空。 函數
在系統啓動後,大部分的設備已經ready,能夠根據須要,從新指定一個uevent helper,以便檢測系統運行過程當中的熱拔插事件。
這能夠經過把helper的路徑寫入到"/sys/kernel/uevent_helper"文件中實現。
實際上,內核經過sysfs文件系統的形式,將uevent_helper數組開放到用戶空間,供用戶空間程序修改訪問,具體可參考"./kernel/ksysfs.c」中相應的代碼。
spa
在/etc/init.d/rcS腳本中添加 echo "/sbin/mdev" > /proc/sys/kernel/hotplug,會發現cat /sys/kernel/uevent_helper 便是/sbin/mdev。
說明/proc/sys/kernel/hotplug中的可執行文件路徑最終仍是會寫到/sys/kernel/uevent_helper中。debug
本身手動echo "/kernel/main" > uevent_helper(以前的/sbin/mdev會被覆蓋),當lsmod、rmmod時,/sys/kernel/uevent_helper中的/kernel/main會執行,
代表事件已經上報給用戶空間。指針
Q1:用戶空間怎樣去識別上報的事件究竟是什麼事件?下一步研究code
call_usermodehelper函數可以方便的在內核中直接新建和運行用戶空間的程序,而且該程序有root權限。
call_usermodeheler函數的參數用法和execve函數一致。
call_usermodehelper()->call_usermodehelper_exec()orm