智源導讀:12月10日,Nature Index 發佈了其 AI 增刊(Nature Index AI supplement),該刊分別使用了Nature Index(天然指數)數據和規模更大的Dimensions數據庫,對全球範圍內的人工智能學術研究作了分析和排名。但根據兩個數據庫的排名,中國的名次變化有點大,前者在美、英、德以後,位居第四;然後者則遠超其餘國家,雄踞第一。數據庫
仔細分析這兩種數據排名,咱們發現:中國在 AI 方向確實已經處於前沿地位,但咱們在將 AI 應用於傳統基礎學科上仍有欠缺。這種欠缺,除了提示咱們應當更加註重基礎研究外,或許也告訴咱們的 AI 專家們:在傳統學科中或許有更多可探索的新天地,而非僅僅侷限在 AI 的核心任務上。人工智能
簡單來講,根據天然指數數據顯示,2015年至2019年期間,儘管中國在天然指數論文庫中的數量迅速增長(2019年論文數量增加到了2015年的340%),但仍排在美、英、德以後,位居第四。這裏能夠看到美國的 Share (後文解釋含義)要大於2~10名所有總和。spa
圖 1:天然指數的國家排名數據分析
然而,根據規模更大的 Dimensions 數據庫,AI領先的國家和地區顯然不一樣。中國在2015-2019年間的出版物以 318534的數量雄踞第一,而印度則以91563的數量排名第三。io
圖2:基於Dimensions Data的國家排名table
這種差異的緣由在於,天然指數數據分析聚焦在指數所追蹤的82本高質量天然科學期刊上發表的AI相關文章的數量,這些期刊主要覆蓋化學、物理、生命科學、地球與環境科學等。所以依據天然指數數據的排名,更強調的是 AI 在化學、物理、生命科學、地球與環境科學等方面的應用。class
而Dimension相對則更爲普遍,包括人工智能相關的各類期刊和會議論文,可追蹤到全部領域AI相關文章的發表狀況。基礎
兩相對比,更突顯了:儘管中國的 AI 研究在整體上居於世界第一(以出版物數量來講),但在化、物、生、地等傳統學科中的應用倒是短板。引用
01 Dimensions Data 中的中國 AIim
使用Dimensions Data,Nature Index AI不只分析了每一個國家的排名,還給出更爲詳細的研究機構的 AI 100 排名。在這個榜單上,來自中國的研究機構主導了前十強機構。
前 10 名中有 7 家來自中國的高校/科研單位:清華大學(第一)、中國科學院大學(第二)、上海交通大學(第三)、北京航空航天大學(第四)、浙江大學(第五)、哈爾濱工業大學(第六)、電子科技大學(第八)。
而前100強機構中,中國佔到 39 家。
名詞 |
研究機構 |
國家/地區 |
出版物2015–2019 |
1 |
清華大學 |
中國 |
11,867 |
2 |
中國科學院大學 |
中國 |
8,835 |
3 |
上海交通大學 |
中國 |
8,796 |
4 |
北京航空航天大學 |
中國 |
8,605 |
5 |
浙江大學 |
中國 |
8,337 |
6 |
哈爾濱工業大學 |
中國 |
8,315 |
7 |
南洋理工大學 |
新加坡 |
6,985 |
8 |
電子科技大學 |
中國 |
6,954 |
9 |
斯坦福大學 |
美國 |
6,609 |
10 |
麻省理工學院 |
美國 |
6,314 |
11 |
東南大學 |
中國 |
6,180 |
12 |
東京大學 |
日本 |
6,058 |
13 |
華中科技大學 |
中國 |
6,048 |
14 |
倫敦大學學院 |
英國 |
5,988 |
15 |
武漢大學 |
中國 |
5,797 |
16 |
北京理工大學 |
中國 |
5,641 |
17 |
北京大學 |
中國 |
5,612 |
18 |
哈佛大學 |
美國 |
5,553 |
19 |
密西根大學 |
美國 |
5,464 |
20 |
西安交通大學 |
中國 |
5,364 |
21 |
國防科技大學 |
中國 |
5,361 |
22 |
西安電子科技大學 |
中國 |
5,277 |
23 |
新加坡國立大學 |
新加坡 |
5,269 |
24 |
西北工業大學 |
中國 |
5,261 |
25 |
多倫多大學 |
加拿大 |
5,205 |
26 |
卡內基·梅隆大學 |
美國 |
5,192 |
27 |
佐治亞理工學院 |
美國 |
5,123 |
28 |
北京郵電大學 |
中國 |
5,010 |
29 |
牛津大學 |
英國 |
4,951 |
30 |
倫敦帝國理工學院 |
英國 |
4,915 |
31 |
天津大學 |
中國 |
4,914 |
32 |
安娜大學安娜 |
印度 |
4,838 |
33 |
加州大學伯克利分校 |
美國 |
4,754 |
34 |
慕尼黑工業大學 |
德國 |
4,551 |
35 |
東北大學 |
中國 |
4,436 |
36 |
劍橋大學 |
英國 |
4,423 |
37 |
中國科學技術大學 |
中國 |
4,368 |
38 |
華盛頓大學 |
美國 |
4,359 |
39 |
伊利諾伊大學香檳分校 |
美國 |
4,282 |
40 |
華南理工大學 |
中國 |
4,239 |
41 |
加州大學洛杉磯分校 |
美國 |
4,179 |
42 |
蘇黎世聯邦理工學院 |
瑞士 |
4,152 |
43 |
大連理工大學 |
中國 |
4,143 |
44 |
同濟大學 |
中國 |
4,112 |
45 |
加州大學聖地亞哥分校 |
美國 |
4,083 |
46 |
悉尼新南威爾士大學 |
澳大利亞 |
4,080 |
47 |
中山大學 |
中國 |
4,058 |
48 |
南加州大學 |
美國 |
4,050 |
49 |
約翰·霍普金斯大學 |
美國 |
4,014 |
50 |
悉尼大學 |
澳大利亞 |
3,860 |
另外一方面,若是是按照增加速率進行排名的話,中國高校/單位近乎呈現一種霸榜的態勢,在前 25 個發展最快的機構中,有 23 個來自中國,而僅有 2 個來自美國:
名次 |
研究機構 |
國家/地區 |
出版物2015 |
出版物2019 |
2015-19年變化 |
變更2015–19(%) |
1 |
中國科學院大學 |
中國 |
653 |
3,236 |
2,583 |
395.6% |
2 |
清華大學 |
中國 |
1,629 |
3,418 |
1,789 |
109.8% |
3 |
電子科技大學 |
中國 |
699 |
2,451 |
1,752 |
250.6% |
4 |
上海交通大學 |
中國 |
1,124 |
2,692 |
1,568 |
139.5% |
5 |
浙江大學 |
中國 |
1,166 |
2,644 |
1,478 |
126.8% |
6 |
東南大學 |
中國 |
711 |
2,099 |
1,388 |
195.2% |
7 |
西北工業大學 |
中國 |
500 |
1,804 |
1,304 |
260.8% |
8 |
哈爾濱工業大學 |
中國 |
1,158 |
2,340 |
1,182 |
102.1% |
9 |
北京航空航天大學 |
中國 |
1,172 |
2,339 |
1,167 |
99.6% |
10 |
北京郵電大學 |
中國 |
500 |
1,660 |
1,160 |
232.0% |
11 |
華中科技大學 |
中國 |
806 |
1,953 |
1,147 |
142.3% |
12 |
北京理工大學 |
中國 |
680 |
1,824 |
1,144 |
168.2% |
13 |
西安電子科技大學 |
中國 |
640 |
1,765 |
1,125 |
175.8% |
14 |
武漢大學 |
中國 |
709 |
1,821 |
1,112 |
156.8% |
15 |
中山大學 |
中國 |
414 |
1,513 |
1,099 |
265.5% |
16 |
天津大學 |
中國 |
568 |
1,621 |
1,053 |
185.4% |
17 |
哈佛大學 |
美國 |
710 |
1,709 |
999 |
140.7% |
18 |
北京大學 |
中國 |
785 |
1,711 |
926 |
118.0% |
19 |
國防科技大學 |
中國 |
655 |
1,578 |
923 |
140.9% |
20 |
中南大學 |
中國 |
314 |
1,219 |
905 |
288.2% |
20 |
斯坦福大學 |
美國 |
943 |
1,848 |
905 |
96.0% |
21 |
中國科學技術大學 |
中國 |
548 |
1,421 |
873 |
159.3% |
22 |
西安交通大學 |
中國 |
720 |
1,591 |
871 |
121.0% |
23 |
重慶大學 |
中國 |
369 |
1,239 |
870 |
235.8% |
24 |
深圳大學 |
中國 |
314 |
1,182 |
868 |
276.4% |
25 |
東北大學 |
中國 |
502 |
1,366 |
864 |
172.1% |
02 天然指數中的中國 AI
正如上文所說,天然指數的數據來源,是 82 本涵蓋化學、物理、生命科學、地球與環境科學的高質量天然科學期刊,所以基於它所分析的 AI 現狀,主要考慮 AI在這些領域中的應用狀況。
首先須要強調一下它的排名計算方式。
1)count:對於一篇論文,若是做者中有一個以上來自中國,那麼中國的count數就加 1(因此有兩個也是加 1);無論文章有多少做者,都是如此。這也就意味着,同一篇文章能夠給多個國家/地區或機構的count數作貢獻。
2)share:假如每篇文章的share 數值爲 1,那麼每一個做者將均分這個總額。例如一篇有10人合做者的論文,每一個做者的share值將爲 0.1,所以做者所隸屬的單位或國家的share值便加 0.1。
從前面圖 1 中能夠看出,美國不管是在count,仍是share上都遠超中國;甚至 share值大於2-10名的國家之和。
天然指數還排名了前 100 強機構,前20名以下,中國僅有中國科學院入榜:
排名 |
機構 |
國家/地區 |
2015–2019 Share |
2015–2019 Count |
國際文章(%) |
1 |
哈佛大學 |
美國 |
331.08 |
937 |
57.0% |
2 |
斯坦福大學 |
美國 |
257.90 |
629 |
54.4% |
3 |
麻省理工學院(MIT) |
美國 |
209.04 |
620 |
59.4% |
4 |
馬克斯·普朗克學會 |
德國 |
167.98 |
628 |
83.0% |
5 |
牛津大學 |
英國(UK) |
132.34 |
495 |
85.3% |
6 |
劍橋大學 |
英國(UK) |
130.68 |
485 |
84.9% |
7 |
中國科學院 |
中國 |
130.00 |
492 |
73.2% |
8 |
UCL |
英國(UK) |
129.70 |
415 |
77.1% |
9 |
紐約市的哥倫比亞大學(CU) |
美國 |
127.56 |
386 |
61.9% |
10 |
國立衛生研究院(NIH) |
美國 |
122.69 |
302 |
52.0% |
11 |
紐約大學(NYU) |
美國 |
117.40 |
353 |
67.4% |
12 |
華盛頓大學 |
美國 |
110.68 |
338 |
59.8% |
13 |
普林斯頓大學 |
美國 |
107.92 |
254 |
52.8% |
14 |
加州大學伯克利分校(UC Berkeley) |
美國 |
107.54 |
329 |
54.1% |
15 |
加州大學聖地亞哥分校(UC San Diego) |
美國 |
100.63 |
297 |
59.6% |
16 |
賓夕法尼亞大學 |
美國 |
98.54 |
296 |
59.8% |
17 |
約翰·霍普金斯大學(JHU) |
美國 |
85.80 |
285 |
52.3% |
18 |
耶魯大學 |
美國 |
83.95 |
273 |
64.5% |
19 |
加州理工學院(Caltech) |
美國 |
83.59 |
205 |
57.1% |
20 |
多倫多大學 |
加拿大 |
83.27 |
290 |
84.5% |
考慮到2015年至2019年的增速,中國也僅有中國科學院和清華大學入榜:
排名 |
機構 |
國家/地區 |
2015–2019 share |
2015–2019 count |
2015-19 count變化 |
2015–19share變化(%) |
1 |
哈佛大學 |
美國 |
89.44 |
273 |
41.68 |
87.3% |
2 |
斯坦福大學 |
美國 |
76.03 |
187 |
39.94 |
110.6% |
3 |
麻省理工學院 |
美國 |
61.77 |
171 |
34.28 |
124.7% |
4 |
加州大學伯克利分校 |
美國 |
35.99 |
101 |
28.57 |
385.1% |
5 |
中國科學院 |
中國 |
40.69 |
173 |
26.69 |
190.7% |
6 |
加州大學聖地亞哥分校 |
美國 |
31.33 |
105 |
21.30 |
212.3% |
7 |
加州大學舊金山分校 |
美國 |
27.17 |
76 |
20.17 |
288.2% |
8 |
耶魯大學 |
美國 |
28.32 |
78 |
19.41 |
218.1% |
9 |
加州大學洛杉磯分校 |
美國 |
24.19 |
90 |
18.18 |
302.8% |
10 |
馬克斯·普朗克學會 |
德國 |
46.71 |
173 |
17.67 |
60.8% |
11 |
賓夕法尼亞大學 |
美國 |
30.33 |
85 |
16.72 |
122.9% |
12 |
劍橋大學 |
英國(UK) |
33.06 |
124 |
16.53 |
100.0% |
13 |
清華大學 |
中國 |
16.73 |
75 |
14.63 |
696.5% |
14 |
瑞士蘇黎世聯邦理工學院 |
瑞士 |
24.61 |
76 |
14.33 |
139.4% |
15 |
賓夕法尼亞州立大學 |
美國 |
16.63 |
40 |
13.72 |
471.1% |
16 |
倫敦帝國理工學院 |
英國(UK) |
18.13 |
82 |
13.67 |
306.1% |
17 |
UCL |
英國(UK) |
35.36 |
108 |
13.49 |
61.7% |
18 |
康奈爾大學 |
美國 |
20.90 |
85 |
13.23 |
172.3% |
19 |
亥姆霍茲德國研究中心協會 |
德國 |
23.37 |
113 |
12.54 |
115.8% |
20 |
杜克大學 |
美國 |
24.22 |
69 |
12.47 |
106.1% |
比較有意思的是,天然指數還進行了醫療機構的 AI 排名,前十名所有來自美國。這說明,醫療 AI 在美國頗有市場。
排名 |
機構 |
國家/地區 |
2015–2019 Share |
2015–2019 Count |
國際文章(%) |
1 |
哥倫比亞大學歐文醫學中心(CUIMC) |
美國 |
68.25 |
216 |
54.2% |
2 |
威斯康星大學醫學 |
美國 |
49.31 |
154 |
48.1% |
3 |
杜克大學衛生系統 |
美國 |
38.32 |
115 |
46.1% |
4 |
加州大學聖地亞哥分校健康科學 |
美國 |
35.59 |
139 |
54.0% |
5 |
麻省總醫院(MGH) |
美國 |
32.00 |
194 |
56.2% |
6 |
紐約大學朗格尼醫學中心(NYULMC) |
美國 |
31.34 |
114 |
58.8% |
7 |
加州大學洛杉磯分校健康 |
美國 |
30.75 |
127 |
59.1% |
8 |
德克薩斯大學西南醫學中心(UT Southwestern Medical Center) |
美國 |
27.97 |
62 |
48.4% |
9 |
UCSF健康 |
美國 |
27.18 |
110 |
40.0% |
10 |
斯隆·凱特琳記念癌症中心(MSKCC) |
美國 |
26.02 |
78 |
60.3% |
03 總 結
Nature Index的排名並不是是對中國 AI 的否認,而Dimensions Data的出版物數量也不能說明中國 AI 已經引領。
圖 3:2015-2019年間,六個國家(中、美、印、德、英、法)在 Share 和出版物數量上的增加狀況
正如許多AI報告指出,中國在論文數量上佔據優點,但平均引用量卻低於世界平均水平。例如《AI 指數報告》統計發現,2019 年來自中國的論文被引用量比世界平均水平低約 20%,而來自美國的論文被引用量比世界平均水平高約 40%。
「僅僅是大量的、沒有持久影響的原始論文並非真正有用的,跟上技術前沿更重要。」牛津大學人類將來研究所研究中國 AI 戰略的 Jeffrey Ding 博士說。
這兩種數據排名的對比告訴咱們,中國在 AI 方向確實已經處於前沿地位,但咱們在將 AI 應用於傳統基礎學科上仍有欠缺。這種欠缺,除了提示咱們應當更加註重基礎研究外,或許也告訴咱們 的AI 專家們:在傳統學科中或許能夠探索更多的新天地,而非僅僅侷限在 AI 的核心任務上。