今天處理網橋的STP的問題遇到了麻煩,對這個東東理論的卻是看了很多,沒有真真學習到它的源理,來看Linux的實現,手頭沒有資料,看了兩個鐘頭,只把網橋的框架結構看完,因此想先貼出來,但願有研究這塊的大哥們討論,繼續把它寫完,好好學習一下:html 版本:Linux 2.4.18前端 1、調用linux 在src/net/core/dev.c的軟中斷函數static void net_rx_action(struct softirq_action *h)中:網絡 line 1479框架
#if defined(CONFIG_BRIDGE) || defined(CONFIG_BRIDGE_MODULE) if (skb->dev->br_port != NULL && br_handle_frame_hook != NULL) { handle_bridge(skb, pt_prev); dev_put(rx_dev); continue; } #endif |
若是定義了網橋或網橋模塊,則由handle_bridge函數處理skb->dev->br_port :接收該數據包的端口是網橋端口組的一員br_handle_frame_hook :定義了網橋處理函數。less 2、初始化函數
src/net/bridge/br.c: static int __init br_init(void) { printk(KERN_INFO "NET4: Ethernet Bridge 008 for NET4.0\n";
br_handle_frame_hook = br_handle_frame; br_ioctl_hook = br_ioctl_deviceless_stub; #if defined(CONFIG_ATM_LANE) || defined(CONFIG_ATM_LANE_MODULE) br_fdb_get_hook = br_fdb_get; br_fdb_put_hook = br_fdb_put; #endif register_netdevice_notifier(&br_device_notifier);
return 0; } |
初始化函數指明瞭網橋的處理函數是br_handle_frameioctl處理函數是:br_ioctl_deviceless_stub。學習 3、br_handle_frame(br_input.c)atom 網橋處理函數spa
void br_handle_frame(struct sk_buff *skb) { struct net_bridge *br; unsigned char *dest; struct net_bridge_port *p;
/*獲取目的MAC地址*/ dest = skb->mac.ethernet->h_dest;
/*skb->dev->br_port用於指定接收該數據包的端口, 若不是屬於網橋的端口,則爲NULL*/ p = skb->dev->br_port; if (p == NULL) /*端口不是網橋組端口中*/ goto err_nolock;
/*本端口所屬的網橋組*/ br = p->br;
/*加鎖,由於在轉發中須要讀CAM表,因此必須加讀鎖, 避免在這個過程當中另外的內核控制路徑(如多處理機上另一個CPU上的系統調用)修改CAM表*/ read_lock(&br->lock); if (skb->dev->br_port == NULL) /*前面判斷過的*/ goto err;
/*br->dev是網橋的虛擬網卡,若是它未UP, 或網橋DISABLED,p->state其實是橋的當前端口的STP計算判斷後的狀態*/ if (!(br->dev.flags & IFF_UP) || p->state == BR_STATE_DISABLED) goto err;
/*源MAC地址爲255.X.X.X,即源MAC是多播或廣播,丟棄之*/ if (skb->mac.ethernet->h_source[0] & 1) goto err; |
衆所周之,網橋之因此是網橋,比HUB更智能,是由於它有一個MAC-PORT的表,這樣轉發數據就不用廣播,而查表定端口就能夠了 每 次收到一個包,網橋都會學習其來源MAC,添加進這個表。Linux中這個表叫CAM表(這個名字是其它資料上看的)。若是橋的狀態是LEARNING或 FORWARDING(學習或轉發),則學習該包的源地址skb->mac.ethernet->h_source,將其添加到CAM表中, 若是已經存在於表中了,則更新定時器,br_fdb_insert完成了這一過程
if (p->state == BR_STATE_LEARNING || p->state == BR_STATE_FORWARDING) br_fdb_insert(br, p, skb->mac.ethernet->h_source, 0); |
STP 協議的BPDU包的目的MAC採用的是多播目標MAC地址:從01-80-c2-00-00-00(Bridge_group_addr:網橋組多播地 址)開始.因此這裏是若是開啓了STP,而當前數據包又是一個BPDU(!memcmp(dest, bridge_ula, 5), unsigned char bridge_ula[6] = { 0x01, 0x80, 0xc2, 0x00, 0x00, 0x00 },則交由相應函數處理。if (br->stp_enabled &&,這裏只比較前5個字節,沒有仔細研究過STP是使用了所有多播地址(從0 1 : 0 0 : 5 e : 0 0 : 0 0 : 0 0到0 1 : 0 0 : 5 e : 7 f : ff : ff。),仍是隻使用了一部份,這裏看來彷佛只是一部份,沒去深究了
!memcmp(dest, bridge_ula, 5) && !(dest[5] & 0xF0)) /*01-80-c2-00-00-F0 是一個什麼地址?爲何要判斷呢?*/ goto handle_special_frame;
/*處理鉤子函數,而後轉交br_handle_frame_finish函數繼續處理*/ if (p->state == BR_STATE_FORWARDING) { NF_HOOK(PF_BRIDGE, NF_BR_PRE_ROUTING, skb, skb->dev, NULL, br_handle_frame_finish); read_unlock(&br->lock); return; }
err: read_unlock(&br->lock); err_nolock: kfree_skb(skb); return;
handle_special_frame: if (!dest[5]) { br_stp_handle_bpdu(skb); return; }
kfree_skb(skb); } |
4、br_handle_frame_finish
static int br_handle_frame_finish(struct sk_buff *skb) { struct net_bridge *br; unsigned char *dest; struct net_bridge_fdb_entry *dst; struct net_bridge_port *p; int passedup;
/*前面基本相同*/ dest = skb->mac.ethernet->h_dest;
p = skb->dev->br_port; if (p == NULL) goto err_nolock;
br = p->br; read_lock(&br->lock); if (skb->dev->br_port == NULL) goto err;
passedup = 0;
/*若是網橋的虛擬網卡處於混雜模式,那麼每一個接收到的數據包都須要克隆一份 送到AF_PACKET協議處理體(網絡軟中斷函數net_rx_action中ptype_all鏈的處理)。*/ if (br->dev.flags & IFF_PROMISC) { struct sk_buff *skb2;
skb2 = skb_clone(skb, GFP_ATOMIC); if (skb2 != NULL) { passedup = 1; br_pass_frame_up(br, skb2); } }
/*目的MAC爲廣播或多播,則須要向本機的上層協議棧傳送這個數據包, 這裏有一個標誌變量passedup 用於表示是否傳送過了,若是已傳送過,那就算了*/ if (dest[0] & 1) { br_flood_forward(br, skb, !passedup); if (!passedup) br_pass_frame_up(br, skb); goto out; }
/*Linux中的MAC-PORT表是CAM表,這裏根據目的地址來查表, 以肯定由哪一個接口把包轉發出去 每個表項是經過結構struct net_bridge_fdb_entry來描述的: struct net_bridge_fdb_entry { struct net_bridge_fdb_entry *next_hash; //用於CAM錶鏈接的鏈表指針 struct net_bridge_fdb_entry **pprev_hash; //爲何是pprev不是prev呢?尚未仔細去研究 atomic_t use_count; //此項當前的引用計數器 mac_addr addr; //MAC地址 struct net_bridge_port *dst; //此項所對應的物理端口 unsigned long ageing_timer; //處理MAC超時 unsigned is_local:1; //是不是本機的MAC地址 unsigned is_static:1; //是不是靜態MAC地址 };*/ dst = br_fdb_get(br, dest);
/*查詢CAM表後,若是可以找到表項,而且目的MAC是到本機的虛擬網卡的, 那麼就須要把這個包提交給上層協議, 這樣,咱們就能夠經過這個虛擬網卡的地址來遠程管理網橋了*/ if (dst != NULL && dst->is_local) { if (!passedup) br_pass_frame_up(br, skb); else kfree_skb(skb); br_fdb_put(dst); goto out; }
/*查到表了,且不是本地虛擬網卡的,轉發之*/ if (dst != NULL) { br_forward(dst->dst, skb); br_fdb_put(dst); goto out; }
/*若是表裏邊查不到,那麼只好學習學習HUB了……*/ br_flood_forward(br, skb, 0);
out: read_unlock(&br->lock); return 0;
err: read_unlock(&br->lock); err_nolock: kfree_skb(skb); return 0; } |
基本框架就是這樣了,與那些講網橋原理的書上講的基本差很少…… 網橋之因此是網橋,主要靠這兩個函數:
一個學習,一個查表;另外,支持STP,處理BPDU,須要用到函數br_stp_handle_bpdu.哪位有這三個函數的細節分析,能否送九賤一份,省得下午那麼辛苦再去啃代碼…… 掃了一下 br_fdb_insert,結構仍是很清析,若是當前項已存在於hash表項中,則更新它(__fdb_possibly_replace),若是是新項,則插入,實際是一個雙向鏈表的維護過程(__hash_link):
void br_fdb_insert(struct net_bridge *br, struct net_bridge_port *source, unsigned char *addr, int is_local) { struct net_bridge_fdb_entry *fdb; int hash;
hash = br_mac_hash(addr);
write_lock_bh(&br->hash_lock); fdb = br->hash[hash]; while (fdb != NULL) { if (!fdb->is_local && !memcmp(fdb->addr.addr, addr, ETH_ALEN)) { __fdb_possibly_replace(fdb, source, is_local); write_unlock_bh(&br->hash_lock); return; }
fdb = fdb->next_hash; }
fdb = kmalloc(sizeof(*fdb), GFP_ATOMIC); if (fdb == NULL) { write_unlock_bh(&br->hash_lock); return; }
memcpy(fdb->addr.addr, addr, ETH_ALEN); atomic_set(&fdb->use_count, 1); fdb->dst = source; fdb->is_local = is_local; fdb->is_static = is_local; fdb->ageing_timer = jiffies;
__hash_link(br, fdb, hash);
write_unlock_bh(&br->hash_lock); } |
一樣,查表也是一個遍歷鏈表,進行地址匹配的過程:
struct net_bridge_fdb_entry *br_fdb_get (struct net_bridge *br, unsigned char *addr) { struct net_bridge_fdb_entry *fdb;
read_lock_bh(&br->hash_lock); fdb = br->hash[br_mac_hash(addr)]; while (fdb != NULL) { if (!memcmp(fdb->addr.addr, addr, ETH_ALEN)) { if (!has_expired(br, fdb)) { atomic_inc(&fdb->use_count); read_unlock_bh(&br->hash_lock); return fdb; }
read_unlock_bh(&br->hash_lock); return NULL; }
fdb = fdb->next_hash; }
read_unlock_bh(&br->hash_lock); return NULL; } |
|