靈芯
本文分析中國大陸學者在ACM各個會議中論文發表狀況。但願以此瞭解中國
在計算機學科的各個分支中所處的地位。找出那些分支是中國的強項,那些分支是
中國的弱項,那些分支中國還處在空白狀態。爲計算機科學發展決策提供參考。
ACM名下的計算機專業會議涵蓋了計算機科學的幾個主要分支最高水平的
會議。其中包括集成電路設計方面的DAC,ISSS,ICCAD會議,體系結構方面的ISCA和
MICRO會議,超級計算方面的SC和ISC會議,程序語言方面的POPL,PPDP會議,操做
系統方面的SOSC會議,數據庫方面的SIGMOD和PODS等等。儘管還有許多重要的會議
不在ACM會議集之中,可是對ACM會議論文發表狀況依然能夠成爲衡量一個國家計算
機科學研究水平的重要依據。
這項研究工做是業餘進行的,因此沒有使用那些須要付費的論文數據庫系
統。研究方法是使用PERL程序直接從ACM網站[4]上抽取出全部的會議論文網頁,再
從這些網頁中抽取出每篇論文第一做者所在單位和國別,而後用AWK程序計算每一種
會議中各個國家的論文數,最後把各個會議中中國的論文數同其餘國家的論文數進
行比較。
因爲一些文章的做者單位欄中沒有包含國別,因此這項統計只是一個近似
的結果。中國大陸的文章一般寫明China,因此遺漏中國論文的狀況很罕見。此外,
咱們把單位名中包含Beijing,Pekin,Shanghai等關鍵字的記錄都統計在中國論文
內。中國臺灣省和香港特區做者的單位名中有時也包含China,統計程序把這些記錄
都排除。本文中除特別說明以外,「中國論文」專指只中國大陸學者的論文。統計
中,遺漏其餘國家論文的狀況相對多一些,好比加拿大多倫多大學有時不標明加拿
大,所以,對其餘國家論文數的統計可能偏少,但不會差的很遠。美國的單位通常
不含國名,所以目前程序尚未統計美國的論文總數。做爲一個替代,程序統計了
美國加州的論文數。程序運行結果代表,美國加州的論文數一般高於其餘發達國家
平均數的數倍。下面會看到,中國同美國加州的差距已經很大。
網絡上抽取論文信息的程序日夜運行整整一個星期,共收集了ACM173個
會議總共八萬多篇論文。這個收集工做包含了大部分ACM會議,個別只有一兩年會議
歷史,尚無歷史文檔的會議沒有統計在內。附錄中列出在每一個會議中中國的論文數,
佔總數百分比以及同國外的比較。
統計結果顯示,在這173個會議中,中國論文超過100篇的會議有三個,
它們是:
會議 中國 佔總數 美國 六個發達國家
代號 論文數 百分比 加州 平均數
AICPS 167 3.85% 136 174
ASPDAC 102 7.23% 161 47
MM 102 5.91% 174 58
上表中的中國論文數指中國大陸學者在該會議中歷年發表的論文總和。
爲了比較,咱們同時列出中國論文數佔會議論文總數的百分比,美國加州在該會議
中的論文總數,六個發達國家(德,法,意,加拿大,澳大利亞和日本)論文總數的
平均值。該表顯示中國在這三個會議中的狀況比較好,論文數超過或接近幾個發達
國家的平均水平。可是在ASPDAC和MM會議中只有美國加州論文數的2/3。
在上述三個會議中,AICPS是一大批會議的總和,其中有些是地區性會議,
有些是近年的專業會議;ASPDAC是南亞地區的集成電路設計會議。雖然地區性會議
不必定表明專業領域的最高水平,可是上述數據也代表中國在集成電路研究方面的
活躍。在該會中,清華大學表現最爲出色,論文數爲56篇,佔了中國論文數的一半
以上。MM是國際多媒體會議,在這個會議上中國論文數超過六個發達國家平均數幾
乎一倍,說明中國已在這一領域進入國際先進行列。在MM中國論文中,微軟中國研
究所36篇,清華27篇,其次是中國科大和浙大。
中國論文數在10篇到99篇之間的會議有8個,它們是:
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
SIGGRAPH 10 2165 0.46% 190 44
CSC 11 1150 0.96% 37 11
VRST 12 281 4.27% 13 10
CIKM 16 1014 1.58% 68 30
ISSAC 17 714 2.38% 23 45
SAC 23 2117 1.09% 84 76
SIGIR 28 1352 2.07% 50 36
WWW 36 731 4.92% 97 25
其中互聯網會議WWW和虛實體軟件會議VRST的論文數超過論文總數的4%,也
超過了六個發達國家的平均數。VRST中表現突出的是浙江大學,佔了12篇論文中的
7篇。其次是符號代數計算會議ISSAC,信息檢索會議SIGIR以及信息和知識管理會議
CIKM,中國論文數佔總數的1.58%到2.38%之間。圖像學和交互式系統會議SIGGRAPH雖
然有10篇論文,但只佔會議論文總數的0.46%,是發達國家平均數的1/4,是美國加
州論文數的1/19。在這個領域中國同國際水準差距很大。CSC(計算機科學)和SAC(應
用計算)兩個會議從名字上看難以納入專業會議,其水平須要內行專家來評價。
在上述「中國論文」中,有很大一批是微軟中國研究院的論文,還有一些
是中國研究單位同國外合做的成果。好比SIGGRAPH 的10篇論文中有9篇來自微軟,
另外一篇文章是復旦大學同美國加州DAVIS 大學合做成果。微軟中國的論文在WWW中佔
了9篇,在SIGIR中佔了12篇。
若是按論文佔會議總數的百分比排列,那麼中國論文佔論文總數2%以上的會
議一共有13個:
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
DOLAP 2 100 2.00% 0 4
SIGIR 28 1352 2.07% 50 36
Middleware 1 47 2.13% 4 1
ISSAC 17 714 2.38% 23 45
ASE 4 162 2.47% 6 6
CF 3 108 2.78% 7 4
WIDM 3 101 2.97% 4 3
GRAPHITE 5 159 3.14% 0 5
AICPS 167 4333 3.85% 136 174
VRST 12 281 4.27% 13 10
WWW 36 731 4.92% 97 25
MM 102 1727 5.91% 174 58
ASPDAC 102 1410 7.23% 161 47
除上面分析過的幾個會議以外,其餘幾個會議規模比較小,其中每一個會議
中中國論文總數不到5篇。
此次分析的ACM會議總共有173個,上面13個會議不到會議總數的8%。下面
是按照中國論文佔會議總數的百分比列出中國論文在ACM會議中的分佈狀況:
中國論文佔會議 會議數
論文總數百分比
> 2% 13
>1% 30
> 0% 76
= 0 97
上表顯示,在97個ACM會議中,中國沒有一篇論文,這些會議佔了本次統計
的ACM會議總數的56%。
下面對ACM會議的幾個大方向作進一步的分析。
核心領域論文發表狀況
一。集成電路設計。
設計自動化會議(Design Automation Conference(DAC))是ACM在集成電路
領域歷史最悠久的會議。自1964年以來的42年中,該會議上共發表過的3281篇論文,
其中中國的論文只有9篇,僅佔論文總數的0.27%。相比之下,法意德在該會議中的
論文數分別爲:43,36,99,高出中國4倍到10倍;南朝鮮和臺灣的論文數爲:36和
56,高出中國大陸4倍到6倍;美國僅加州一地在該會議上的論文數就達673篇,高出
中國七十幾倍,中美間的差距之大幾乎沒法衡量。
在中國的9篇論文中,有6篇是同美國大學或公司合做的論文,3篇徹底獨
立寫成的文章所有是15年前寫的。
值得指出的是,清華大學的論文佔了9篇中的6篇。
下面是集成電路設計相關的幾個主要會議上中國論文發表狀況(南亞地區
會議ASPDAC沒包括在內):
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
CODES 0 398 0.00% 51 14
ISSS 0 322 0.00% 53 14
SBCCI 0 111 0.00% 6 5
DATE 3 1414 0.21% 120 51
DAC 9 3281 0.27% 673 59
ICCAD 5 1483 0.34% 342 25
EuroDAC 2 487 0.41% 48 26
ISLPED 4 746 0.54% 116 17
FPGA 5 459 1.09% 100 15
ISPD 6 338 1.78% 88 5
GLVLSI 7 368 1.90% 34 9
總計 41 9296 0.44% 1625 235
在這些會議中,清華大學的論文數爲21篇,佔中國論文數一半以上。顯示出
清華大學在集成電路研究方面的國內領先地位。尤爲是在物理設計領域,清華佔了
6篇論文中的5篇。另外,復旦大學在FPGA領域比較突出,佔了5篇論文中的3篇。
總體而言,中國在上述集成電路會議中的論文數不到六個發達國家平均數的
1/5,至關於美國加州論文數的1/40。相比之下,中國在物理設計(ISPD)和可編程邏
輯(FPGA)方面狀況稍好,在系統設計(CODES,ISSS,SBCCI)方面的研究最差。其次
是設計測試(DATE)和設計自動化(DAC,ICCAD,EuroDAC)。
下面是這幾個會議的中文簡稱,開始年份和論文錄取率狀況。
代號 中文簡稱 起始年 錄取率
CODES 軟硬件協同設計 94 30%
ISSS 系統綜合 94 35%
SBCCI 集成電路與系統設計 97 34%
DATE 設計與測試 98 21%
DAC 設計自動化 64 30%
ICCAD 輔助設計 92 26%
EuroDAC 歐洲設計自動化 90 無
ISLPED 低功耗設計 95 32%
FPGA 可編程邏輯 95 50%
ISPD 物理設計 97 無
FPGA 可編程邏輯 95 50%
GLVLSI 大湖區集成電路 00 無
二。體系結構
在體系結構方面,中國的論文發表狀況比集成電路更差。在有33年曆史的計
算機體系結構權威會議ISCA中,中國的論文數是零。 在微體系結構會議MICRO上,
中國有9篇論文,佔論文總數的1.48%,但是這些論文都是在1994年以前的,大部分
是在85年到88年之間所作,95年以後一篇論文也沒有。僅從論文數量看,最近十年
中國在體系結構方面的學術研究不但沒有前進,反而出現倒退。這種狀況可能同中
國當前的「芯片熱」有關,許多研究人員轉向了芯片的產品開發,離開了體系結構
的學術研究。另外一個緣由是有能力在這些重要會議上發表論文的學者轉到了國外,
好比在MICRO上發表了4篇論文的清華學者Bogong Su先生,如今在美國William Paterson
大學工做,總共發表了34篇論文。
下面是ACM會議中幾個主要的體系結構有關的會議中,中國論文的發表狀況:
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
ASPLOS 0 264 0.00% 41 2
CASES 0 196 0.00% 28 4
ISCA 0 992 0.00% 116 11
PACT 0 67 0.00% 3 0
SPAA 0 559 0.00% 56 18
SC 1 1229 0.08% 143 16
ICS 1 729 0.14% 46 20
MICRO 9 608 1.48% 68 6
Total 11 4644 0.24% 501 77
在這七個會議中,中國在五個會議中的論文數是空白。超級計算會議SC中
惟一的一篇論文是北京基因組研究所的計算機應用論文,不能算做體系結構方面的
論文;另外一個超級計算會議ICS的論文是計算所編譯組同INTEL和DELWARE大學合做的
論文;MICRO方面的9篇論文是10年前的論文。換句話說,中國在最近十年內,在ACM體
繫結構方面的論文是空白。
固然,這並不等於說中國在體系結構學術研究方面是空白。在ACM以外,還
有至關一批重要的體系結構會議,好比ISCIS,HPCA,ICCD,ASAP等等。可是中國在
ACM會議中的狀況,畢竟反映出中國在體系結構方面研究力量的薄弱。
另外,下表顯示,ACM這幾個會議都是論文競爭至關激烈的會議,尤爲ASPLOS,ISCA和
MICRO這幾個歷史長久的會議,錄取率僅在20%,五篇論文中只錄取一篇。中國在這
些會議中沒有論文,至少說明中國缺少高水平的研究工做。
下面是上述ACM體系結構會議的中文簡稱以及論文錄取率等信息:
代號 中文簡稱 起始年 錄取率
ASPLOS 對語言和操做系統的體系結構支持 73 20%
CASES 嵌入式系統編譯,體系結構和綜合 00 25%
ISCA 體系結構 73 20%
PACT 並行體系結構及編譯技術 93 無
SPAA 並行算法和體系結構 89 37%
SC 超級計算 88 24%
ICS 超級計算 89 30%
MICRO 微體系結構 73 20%
三。軟件工程,數據庫和人機界面。
在這個欄目下面,咱們把軟件工程,數據庫,交互式系統,文檔,超文本的會
議都放在一塊兒。這種分類可能會有爭議。可是從咱們提供的數據中不難分析出各專
門領域的狀況。下面是歸在此類的全部會議:
代號 中文簡稱 起始年 錄取率
ISSTA 軟件測試與分析 73 20%
SIGSOFT 軟件工程基礎 82 25%
ICSE 軟件工程 76 17%
PODS 數據庫系統原理 82 22%
SIGMOD 數據管理 74 17%
VLDB 超大規模數據庫 82 無
SIGIR 信息檢索 71 20%
SIGDOC 計算機文檔 82 50%
UIST 用戶界面軟件與技術 88 21%
ICIS 信息系統 89 無
IUI 智能用戶界面 89 30%
CHI 計算機系統中人的因素 77 20%
DIS 交互式系統設計 95 無
HT 超文本 87 40%
SV 軟件可視性 73 20%
SSR 軟件可重用性 95 43%
SCM 軟件配置管理(workshop) 89 無
WOSP 軟件與性能(workshop) 98 55%
在這些會議中ISSTA,SIGSOFT,ICSE是軟件工程方面的主幹會議,論文錄
取率在20%左右。在這三個會議中,中國的論文總數是6篇,佔所有論文數的0.21%。
其中SIGSOFT的三篇文章所有是北大的。ICSE中也有一篇北大文章。
SIGMOD和PODS是數據庫方面的主要會議。前者錄取率爲35%,上面有9篇中國
論文;後者錄取率只有18%,該會議上惟一的一篇中國論文是重慶大學Ke Wang所寫
的論文,但時間是17年前。
SIGIR信息檢索會議是這批會議中中國論文最多的一個會議,中國共有28篇
論文,佔總數2%多。在這批論文中,微軟佔了12篇,其次是清華大學5篇,其中有2篇
是同微軟合做成果。
在用戶界面會議方面,中國在IUI會上的論文佔論文總數0.84%,這個比例在
各個會議中佔第二名。IUI的5篇中國論文中有3篇出自北京中科院。
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
DIS 0 237 0.00% 20 3
ISSTA 0 205 0.00% 18 3
SCM 0 55 0.00% 4 1
SIGDOC 0 607 0.00% 35 13
SSR 0 105 0.00% 8 3
VLDB 0 146 0.00% 15 3
CHI 6 4471 0.13% 595 97
PODS 1 671 0.15% 75 18
ICSE 3 1918 0.16% 129 70
UIST 1 472 0.21% 80 15
ICIS 1 432 0.23% 0 5
HT 2 621 0.32% 57 17
SIGSOFT 3 675 0.44% 50 21
SIGMOD 9 1790 0.50% 223 35
WOSP 1 164 0.61% 10 8
IUI 5 595 0.84% 60 21
SIGIR 28 1352 2.07% 50 36
Total 60 14516 0.41% 1429 369
在這17個會議中,中國在6個會議中尚處空白狀態。另外,CHI的6篇文章
有5篇是微軟的,另外1篇來自IBM中國研究所。PODS上的文章是17年前的。因此,在
最近17年中,中國實際上在8個軟件會議中是空白。其餘幾個會議,除SIGIR 之外,
論文數量佔會議論文總數的百分之一如下。在軟件工程這個領域中,中國論文數是
六個發達國家平均數的1/6,是美國加州的1/23。
四。操做系統,網絡通信和分佈式計算。
在這個欄目下面咱們很勉強地把操做系統會議SOSP,通信會議COMM和分佈是
計算會議PODC放在一塊兒。這幾個領域不象其餘行業那樣有一大批相關的ACM會議。然
而這幾個會議歷史都很長,率取率也比較低。SOSP會議是一個有將近40年的操做系
統會議,在此會議上中國論文一篇也沒有。分佈式計算會議PODC上也沒有中國的論
文。COMM上有兩篇中國論文,一篇來自國防科大,另外一篇來自南京通信工程學院。
國防科大的文章發表在2003年,當年的錄取率僅爲11%,幾乎是10文章中挑選1篇;
南京通信工程學院Guo Chuanxiong的文章發表在2001年,當時的錄取率爲9%。
代號 中文簡稱 起始年 錄取率
SOSP 操做系統原理 67 18%
COMM 計算機通信的應用技術和體系結構 69 11%
PODC 分佈式計算原理 82 30%
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
PODC 0 849 0.00% 75 13
SOSP 0 331 0.00% 54 1
COMM 2 817 0.24% 94 14
Total 2 1997 0.10% 223 28
五。圖形學與多媒體
在虛擬實體會議VRST和多媒體會議MM上,中國的狀況比較好,很是罕見的能
夠佔到論文總數的4%--6%之間。VRST上的論文都是中國本身獨立完成的,MM上雖然
有32篇微軟的論文,但中國本身的論文仍是佔了大多數。圖形學自己的論文狀況接
近空白。SCG上惟一的一篇論文是明尼蘇達大學同北京中科院合寫的文章,SIGGRAPH
上有8篇文章出自微軟,1篇出自IBM,另外一篇是復旦與美國DAVIS大學合做。
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
PVG 0 45 0.00% 5 1
SCCG 0 114 0.00% 1 2
SI3D 0 220 0.00% 13 1
SCG 1 907 0.11% 72 28
SIGGRAPH 10 2165 0.46% 190 44
VRST 12 281 4.27% 13 10
MM 102 1727 5.91% 174 58
Total 125 5459 2.29% 468 144
代號 中文簡稱 起始年 錄取率
PVG 並行和大規模數據可視性 99 無
SCCG 圖形學 73 無
SI3D 交互式3D圖像 87 27%
SCG 計算幾何 85 35%
SIGGRAPH 圖像與交互式技術 74 無
MM 多媒體 93 48%
VRST 虛實體軟件與技術 97 36%
六。程序語言。
ACM集中了程序設計語言的許多重要會議,在這些會議的有關信息及中國
論文發表狀況見下面的兩個表。
代號 中文簡稱 起始年 錄取率
POPL 程序語言原理 73 20%
OOPSLA 面向對象程序語言 86 19%
PLDI 程序語言設計與實現 87 22%
PPoPP 並行程序設計原理 90 30%
PPDP 說明式語言與實現 00 46%
ICFP 函數式語言 96 30%
CGO 代碼生成與優化 03 32%
PEPM 部分求值和基於語義的程序變換 91 50%
LCTES 嵌入式系統的語言,編譯和工具 95 26%
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
LCTES 0 168 0.00% 13 3
POPL 0 860 0.00% 58 16
PPDP 0 142 0.00% 3 8
OOPSLA 1 1205 0.08% 88 24
ICFP 1 310 0.32% 5 9
PLDI 2 495 0.40% 65 6
PEPM 1 166 0.60% 2 6
PPoPP 2 188 1.06% 24 2
CGO 1 89 1.12% 4 0
Total 8 3623 0.22% 262 74
POPL是歷史最久,名望最高的會議,在這個會議的33年曆史上,全中國沒
有一篇論文(包括中國大陸,香港和臺灣)。面嚮對象語言OOPSLA,函數語言ICFP,
語言設計與實現PLDI以及嵌入式系統語言和編譯LCTES均屬於語言方面有至關規模的
高水平會議。PLDI上僅有的兩篇論文來自INTEL中國軟件中心,做者是普林斯頓大學
博士畢業。ICFP和OOPSLA兩個會議上各有一篇中國大陸論文, ICFP上的論文做者是
軟件所Chen Haiming。OOPSLA上惟一的中國論文做者是Yingliang Zhao,他署名的
單位是西安交大和加拿大Regina大學。LCTES則沒有中國大陸的論文。PPDP是一個比
較新的語言會議,沒有中國論文。並行程序設計PPoPP是一個跨領域的會議,其中的
一部份內容是並行語言。該會上有兩篇中國論文,一篇來自INTEL上海軟件中心,另
一篇是中國科技大學與INTEL編譯組合寫。PEPM和CGO是語言領域內比較專門的兩個
方向,這兩個會各有一篇中國論文。PEPM上的論文是一個在武漢大學(學習/工做?
)的俄羅斯人的論文,CGO上的論文來自INTEL軟件中心。
整體而言,在8篇論文中,INTEL佔了5篇(包括與科大合做的一篇),外國
人一篇,在中加兩個單位同時工做的學者一篇。可以徹底算作中國獨立完成的論文
只有軟件所Chen Haiming在ICFP上的論文。
即便按8篇論文計算,中國在語言方面的論文也只有6個發達國家平均值的1/9,
美國加州論文數的1/32。
整體分析
以上是ACM會議裏幾個比較大的研究領域中中國論文的分佈狀況。其餘研
究領域再也不一一分析。附錄中列出了每一個會議的狀況。
在本次統計的173個ACM會議(包括會議集)中,中國大陸第一做者的論文
總共有713篇,佔論文總數83227的0.83%。相比之下,六個發達國家的平均數爲1926篇,
美國加州的論文數爲7481篇。在713篇中國論文中,大約有90篇是外國研究單位的論
文,其中微軟73篇,INTEL有9篇,IBM有6篇,此外還有一部分是中外合做論文,完
全由中國獨立完成的論文估計在600篇左右。這個統計過程可能有一些偏差,可是基
本上可以反映中國在ACM上論文發表狀況。
今年,中國已經超過英國、法國成爲世界第四大經濟體。本文中特別把中
國的論文發表狀況同除美國以外的六個發達國家進行比較。統計顯示,中國獨立發
表的論文數不到這些發達國家平均水平的1/3,中國的ACM論文發表狀況同中國的經
濟地位不相稱。
根據2005年成都文獻情報中心鄭穎[3]等人的研究,2003年中國被SCI收
錄的論文數已達到世界SCI論文總數的4.48%。可是在ACM會議中,中國論文(包括在
中國的外國公司)僅佔0.83%,遠遠落後於中國的SCI論文平均發表水平。在中國論文
中,有371篇集中在AICPS,ASPDAC和MM三個會議中,剩下的論文只有342篇。這些論
文佔剩餘的170個會議的75757篇論文中的0.45%,僅爲SCI中國論文收錄率的十分之
一。這種狀況代表,雖然中國的論文總數至關可觀,可是較高水平的計算機科學研
究工做依然稀少。
中國科學院天然科學史研究所張利華[2]和成都文獻情報中心鄭穎[3]等人
的研究顯示,自90年以來中國的SCI論文發表量以每一年兩位數的百分比增加,近年的
增加速度達到每一年20%。可是在ACM的核心專業會議中卻很難看到這種增加,一些專
業甚至出現倒退的跡象。好比微體系結構的MICRO會議,在10多年前尚有9篇論文,
而近10年內一篇也沒有。
最近十年裏,一批覈心領域的主幹會議上沒有一篇徹底由中國獨立完成的
論文。這些會議是:
體系結構方面的ISCA和MICRO會議
程序語言方面的POPL會議
操做系統方面的SOSP會議
數據庫方面的PODS會議
MICRO會議和PODS在十年前有中國論文。POPL,SOSP和ISCA則歷來沒有
中國論文。集成電路方面的DAC會議雖然有9篇論文,但有6篇是同國外合做的論文,
另外3篇是15年前的論文。軟件工程的兩個重要會議SIGSOFT,ISCE上共有有6篇中國
獨立論文。
並不是全部重要會議都在ACM之中,但ACM在集成電路,體系結構,軟件工程
已及程序語言方面集中的高水平會議比較多。在這幾個大的方向上,中國論文發表
的整體狀況以下:
會議 會議 中國 論文 中國論文 美國
六個發達
代號 數量 論文數 總數 佔總數百分比 加州 國家
平均數
集成電路 11 41 9296 0.44% 1625 235
軟件工程 17 60 14516 0.41% 1429 369
體系結構 8 11 4644 0.24% 501 77
程序語言 9 8 3623 0.22% 262 74
集成電路方面另有100多篇論文在南亞地區的ASPDAC會議上,若是加上這些
論文,集成電路方向的論文將達到論文總數的1.32%。體系結構的8個會議中,中國
共10篇文章;在近十年中,在體系結構方面文章數其實是零。在程序語言方向的
9個會議中,中國共8篇文章,徹底由中國獨立完成的文章僅一篇。整體而言,中國
在集成電路和軟件工程兩大方向上狀況稍好,體系結構和程序語言方向至關弱。
ACM在其餘幾個領域中也有一批至關重要的會議,可是並無象上述幾個大
方向那樣構成會議羣。
這項研究工做只是一個初步的分析,其中對大方向的劃分,會議重要性評
價等等不免有誤。更準確的分析須要專家評定各領域中會議的重要性程度,而且全
面考察包括ACM在內的各個計算機會議中論文發表狀況。在此分析的重點是計算機核
心領域的會議,計算機應用領域衆多,對應用領域的分析不是本次統計工做的重點。
幾點初步意見
一。科研考覈須要參考論文錄取率。近年來使用SCI論文數的考覈方式明
顯提升了中國的論文數量。可是不一樣會議的錄取率狀況相差很大。即便在ACM會議之
間,錄取率也很不相同,MM會議2篇投稿取1篇,ISCA會議5篇投稿取1篇,把這些不
同錄取率的會議論文平等看待顯然不公平。若是隻考覈論文數量,會使科研人員棄
難求易,專一於容易發表論文的領域,從而使許多難以發表論文的重要研究方向成
爲空白。科研政策應該對錄取率低的會議論文,以及填補國家空白的會議論文給予
更多的鼓勵。
二。學術研究須要全面發展。中國是發展中國家,經費有限。發展戰略
上一直有集中發展仍是全面發展之爭。兩彈一星是集中資源發展的成功範例,大躍
進則是過度集中力量於鋼鐵糧食而致使經濟全面倒退的例子。此次統計中發現,多
達一半以上的中國論文集中在三個會議中,其他的一半分佈在另外170個會議裏,發
展狀況極不平衡。此外,在超過一半以上的ACM會議中,中國的論文是零。這種狀況
代表,填補大量的空白領域是中國計算機科學的當務之急。以往的科研政策把研究
經費大量集中於少數幾個重點單位,可是計算機的分支多如牛毛,幾個單位的力量
不可能覆蓋全部研究分支。國家對龍芯等重點項目的支持確定是正確的,可是與此
同時也要兼顧其餘大學和研究單位的發展。全面發展的一個重要理由是爲了商業化。
一個單項成果不管怎樣優秀,很難獨立成爲商品。單項科研成果一般被技術全面的
大公司所吸取,而後轉化成生產力。在目前狀況下,不少研究工做對中國沒有用處,
由於沒有配套的技術使之轉換成商品。因此從商業化角度看,科研的全面發展是必
須的。
三。提升學術研究人員的待遇。本次研究顯示,中國在計算機科學的基
礎研究如體系結構和程序語言方面特別薄弱,有些地方甚至出現倒退。好比中國在
10年前有MICRO會議論文,如今反而沒有。其中一個重要緣由是難以留住研究人才。
好比在MICRO上發表了四篇論文的清華大學Bogong Su先生去了美國。雖然中國近幾
年中有大批海龜迴流,可是他們的絕大部分去了公司或在大學研究所裏從事盈利性
項目。繼續作純學術研究的海龜雖然有,但數量至關少。由此形成計算機行業學術
研究人才入不敷出。這種現象的一個重要緣由是以工資收入爲主的人羣在最近幾年
的生活相對貧困化,工資的增加趕不上生活必須開銷的增加。僅以住房爲例,上海
北京等大城市幾年內房價上升二倍到三倍。市區及周邊地區房價至關於美國中等城
市的房價。這種狀況使科研人員難以安心學術研究,尤爲是對青年學者和海龜更是
如此。若是待遇問題得不到妥善解決,中國科研人員即便作出成績,也會很快跳槽
到國外。
四。增長計算機科學研究的投入。本次統計結果顯示,中國在集成電路,
軟件工程,體系結構和程序語言幾個大領域中,論文數僅爲六個發達國家平均水平
的1/6到1/8。同美國相比差得更遠,僅爲美國加州的1/30到1/50。若是扣除10年前
發表的論文,扣除外國研究單位的論文,這個差距還要大得多。這種情況同中國現
有的經濟實力是不相稱的,中國至少應該努力使各個會議的論文數達到除美國之外
發達國家的平均水平。集成電路設計和軟件設計行業是對環境沒有污染,基本不消
耗天然資源的行業,這個行業特別適合象中國這樣人均資源稀缺的國家,應該獲得
國家的優先支持。在上世紀初,美國重應用輕基礎,可是在60年代,因爲蘇聯的挑
戰,促使美國對科研政策作了重大改革,成立了NSF,NASA等機構支持基礎科學研究,
使得美國的科技發展和經濟實力全面領先世界。這一歷史經驗應該對中國有所啓發。
結語
李開復先生在致李嵐清副總理的信[1]中指出,中國的「研究水平遠遠落後
於國外」,「絕大多數的中國的計算機研究項目在美國都沒法拿到經費」。張利華
[2],鄭穎[3]等人對中國SCI論文的分析顯示,中國高質量的論文較少。雖然中國論
文數量在世界排名第8位,然而,平均每篇論文引用率排124位。本文經過對ACM會議
的論文統計,更爲具體地分析了中國在一批計算機核心領域同國外的差距。
孫子兵法曰:「知彼知己,百戰不殆」。中國要提升計算機科學的水平,
瞭解中國同世界水平的差距是第一步。ACM 專業會議的論文數就比如澳運體育項目
的獎牌數。在1984 年的奧運會會上,中國金牌總數5塊,排名第11位。當時,中國
在許多澳運項目中都是空白。因爲舉國上下對這些空白點的重視,中國的澳運獎牌
數終於在2004年上升到32塊,排名世界第二。指望政府可以象重視澳運那樣重視計
算機科學的發展,改變計算機科學研究的落後局面。
[1] 李開復致李嵐清副總理談教育
http://www.sx228.com/news0001/200511/20051128_23712.htm
[2] 張利華 藉由SCI的中國學術研究能量之國際比較,中國科學院天然科學史研究
所
http://www.ihns.ac.cn/zhanlue/wencong/zhanglihua0401.htm
[3] 鄭穎 我國科技論文數量和影響力不成比例,成都文獻情報中心
http://www.cas.cn/html/Dir/2005/11/23/13/50/99.htm
[4] ACM Proceedings
http://portal.acm.org/browse_dl.cfm?linked=1&part=series&coll=ACM&dl=ACM&CFID=69474979&
CFTOKEN=24508287
[5] 集成電路方面會議列表
http://www.eecs.umich.edu/~brown/conference_list.html
[6] 體系結構方面會議列表
http://www.cs.wisc.edu/arch/www/conferences.html
[7]VLSI Conferences
http://www.eecs.umich.edu/~brown/conference_list.html
附錄 中國ACM會議論文分佈狀況
會議 中國 論文 中國論文 美國 六
個發達國家
代號 論文數 總數 佔總數百分比 加州 平
均數
AFRIGRAPH 0 89 0.00% 1 2
ANSS 0 229 0.00% 8 2
AOSD 0 94 0.00% 1 4
APL 0 828 0.00% 34 22
ASPLOS 0 264 0.00% 41 2
ASSETS 0 198 0.00% 14 5
AVI 0 235 0.00% 13 13
C&C 0 125 0.00% 3 6
CASES 0 196 0.00% 28 4
CCSC 0 453 0.00% 2 0
CFP 0 77 0.00% 8 1
CITC 0 189 0.00% 3 0
CODES 0 398 0.00% 51 14
COLT 0 273 0.00% 18 8
CPR 0 631 0.00% 31 5
CQL 0 55 0.00% 5 0
CUU 0 57 0.00% 3 1
CVE 0 59 0.00% 4 1
DIS 0 237 0.00% 20 3
DPDS 0 40 0.00% 2 1
ECLIPSE 0 67 0.00% 5 2
EMSOFT 0 89 0.00% 14 4
ETRA 0 114 0.00% 5 2
EW 0 359 0.00% 19 9
FMSE 0 26 0.00% 2 0
FMSP 0 24 0.00% 5 0
FPCA 0 88 0.00% 6 1
HOPL 0 38 0.00% 2 0
HWWS 0 122 0.00% 11 3
ICAIL 0 283 0.00% 4 8
IOPADS 0 30 0.00% 1 0
IQIS 0 21 0.00% 2 1
IRTAW 0 130 0.00% 3 2
ISCA 0 992 0.00% 116 11
ISMM 0 71 0.00% 4 1
ISPW 0 74 0.00% 7 1
ISSS 0 322 0.00% 53 14
ISSTA 0 205 0.00% 18 3
ITiCSE 0 991 0.00% 15 19
IVME 0 17 0.00% 4 0
IWSSD 0 173 0.00% 8 4
InfoSecCD 0 58 0.00% 3 0
LCTES 0 168 0.00% 13 3
LFP 0 144 0.00% 6 2
MobiCom 0 376 0.00% 53 6
MobiDE 0 54 0.00% 6 0
MobiSYS 0 71 0.00% 8 0
NOSSDAV 0 114 0.00% 15 1
NPAR 0 53 0.00% 2 0
NPIVM 0 45 0.00% 4 2
NSPW 0 169 0.00% 15 3
PACT 0 67 0.00% 3 0
PADS 0 290 0.00% 25 7
PASTE 0 83 0.00% 3 1
PLI 0 38 0.00% 1 0
PODC 0 849 0.00% 75 13
POMC 0 24 0.00% 0 0
POPL 0 860 0.00% 58 16
PPDP 0 142 0.00% 3 8
PRS 0 24 0.00% 3 0
PVG 0 45 0.00% 5 1
RBAC 0 102 0.00% 1 3
SACMAT 0 183 0.00% 4 6
SASN 0 43 0.00% 5 1
SBCCI 0 111 0.00% 6 5
SCC 0 120 0.00% 9 1
SCCG 0 114 0.00% 1 2
SCM 0 55 0.00% 4 1
SESPSDE 0 91 0.00% 9 2
SETA 0 25 0.00% 1 0
SI3D 0 220 0.00% 13 1
SIGCSE 0 2451 0.00% 103 17
SIGDOC 0 607 0.00% 35 13
SIGFORTH 0 22 0.00% 3 0
SIGSMALL_PC0 162 0.00% 4 5
SIGUCCS 0 1507 0.00% 83 5
SLIP 0 110 0.00% 30 1
SOSP 0 331 0.00% 54 1
SPAA 0 559 0.00% 56 18
SPDT 0 41 0.00% 5 0
SRV 0 3 0.00% 0 0
SSR 0 105 0.00% 8 3
TLDI 0 21 0.00% 2 0
VIS 0 1090 0.00% 96 18
VLDB 0 146 0.00% 15 3
VRML 0 127 0.00% 15 6
WADAS 0 210 0.00% 11 1
WMC 0 25 0.00% 0 0
WORM 0 31 0.00% 5 0
WOSS 0 44 0.00% 6 0
WPDD 0 59 0.00% 4 0
WPES 0 62 0.00% 5 1
WS 0 21 0.00% 3 0
WSNA 0 33 0.00% 9 0
Web3D 0 205 0.00% 16 9
WoWMoM 0 64 0.00% 3 2
XMLSEC 0 24 0.00% 3 1
SODA 1 1580 0.06% 168 43
OOPSLA 1 1205 0.08% 88 24
SC 1 1229 0.08% 143 16
SCG 1 907 0.11% 72 28
CHI 6 4471 0.13% 595 97
ICS 1 729 0.14% 46 20
STOC 2 1465 0.14% 170 20
PODS 1 671 0.15% 75 18
ACM-SE 1 624 0.16% 2 1
ICSE 3 1918 0.16% 129 70
WSC 6 3656 0.16% 245 33
DATE 3 1414 0.21% 120 51
UIST 1 472 0.21% 80 15
ICIS 1 432 0.23% 0 5
COMM 2 817 0.24% 94 14
CSCW 1 407 0.25% 66 10
SIGMETRICS 2 798 0.25% 75 12
CCS 1 371 0.27% 37 11
DAC 9 3281 0.27% 673 59
RECOMB 1 355 0.28% 71 8
EDTC 1 342 0.29% 31 14
AGENTS 5 1619 0.31% 113 48
HT 2 621 0.32% 57 17
ICFP 1 310 0.32% 5 9
ICCAD 5 1483 0.34% 342 25
PLDI 2 495 0.40% 65 6
EuroDAC 2 487 0.41% 48 26
SIGSOFT 3 675 0.44% 50 21
SIGGRAPH 10 2165 0.46% 190 44
SIGMOD 9 1790 0.50% 223 35
SIGPLAN 1 201 0.50% 13 6
DL 4 774 0.52% 92 7
GROUP 2 375 0.53% 31 15
ISLPED 4 746 0.54% 116 17
Hypercube 1 178 0.56% 63 0
MobiHoc 1 179 0.56% 22 2
PEPM 1 166 0.60% 2 6
WOSP 1 164 0.61% 10 8
DocEng 1 159 0.63% 7 9
IMW 1 136 0.74% 21 1
IUI 5 595 0.84% 60 21
EC 2 231 0.87% 41 2
SIGAda 6 655 0.92% 48 9
CSC 11 1150 0.96% 37 11
JAVA 1 101 0.99% 11 2
KCAP 1 101 0.99% 12 4
PPoPP 2 188 1.06% 24 2
FPGA 5 459 1.09% 100 15
SAC 23 2117 1.09% 84 76
MSWiM 3 272 1.10% 15 15
CGO 1 89 1.12% 4 0
VolVis 1 84 1.19% 7 1
DIAL_M 1 82 1.22% 3 2
IEA_AEI 7 536 1.31% 26 18
KDD 9 650 1.38% 66 12
NetGames 1 72 1.39% 1 4
MICRO 9 608 1.48% 68 6
CIKM 16 1014 1.58% 68 30
ISPD 6 338 1.78% 88 5
SM 6 336 1.79% 15 10
GIS 5 277 1.81% 21 13
GLVLSI 7 368 1.90% 34 9
SYMSAC 1 51 1.96% 1 2
DOLAP 2 100 2.00% 0 4
SIGIR 28 1352 2.07% 50 36
Middleware 1 47 2.13% 4 1
ISSAC 17 714 2.38% 23 45
ASE 4 162 2.47% 6 6
CF 3 108 2.78% 7 4
WIDM 3 101 2.97% 4 3
GRAPHITE 5 159 3.14% 0 5
AICPS 167 4333 3.85% 136 174
VRST 12 281 4.27% 13 10
WWW 36 731 4.92% 97 25
MM 102 1727 5.91% 174 58
ASPDAC 102 1410 7.23% 161 47html