Intel於1971年發售了本身的第一款4位微處理器,設計與ROM 4001,RAM 4002和移位寄存器4003配合工做。其中4004自身負責運算,其它部分則是使CPU正常工做的重要組成。大部分4004被用於計算器和其它相似的設備,而不是用在計算機中。它的最大頻率只有740KHz。4004的後繼產品是4040,實質上是4004的改進版本,增長了擴展指令集並提升了性能。前端
二.8008和8080(1972)緩存
4004使得Intel成爲了一家微處理器公司,爲了適應潮流,Intel發佈了新的8位處理器系列。8008,8080和8085分別於1972年,1974年和1975年發佈。安全
儘管8008是第一款8位處理器,可是並無前任4004或者繼任者8080那麼著名。藉助於8位數據傳輸,它的性能比4004有所提高,但頻率依舊保守地定在200-800KHz之間,使用10微米工藝製造的8008的性能並無打動消費者們。服務器
Intel的8080處理器則要成功的多,它增長了新的指令集並採用了6微米的製造工藝。這讓頻率幾乎翻了一番,1974年性能最高的8080達到了2MHz的頻率。8080被用到了大量的設備上去,這吸引了許多開發者,例如剛成立不久的微軟,投身到Intel處理器的軟件開發上。到8086發佈的時候,它經過兼容8080來保持軟件兼容性。結果是8080系列處理器和其餘的關鍵硬件遍及當時全部的X86微機系統,8080的軟件能夠在任何X86處理器上運行。8085是8080的低價高能版本,儘管很成功但影響力不大架構
8086:X86的起點(1978)性能
Intel的第一款16微處理器,相比於8080大有提高。不只頻率更高,並且16位總線和其它附加硬件容許8086同時執行兩條8位指令。它也能執行更高效的16位任務,但此時大多數軟件是8位軟件,因此支持16位在多任務能力面前顯得不那麼重要。地址總線則擴展到了20位,使得8086能夠存取1MB的內存,於是提升了性能。測試
8086是史上第一款X86處理器,使用初版的X86指令集架構,這是往後AMD和Intel幾乎全部處理器的基石。優化
Intel與此同時也在生產8088處理器,這款處理器以8086爲藍本,可是外部總線只有8位。由於依舊能訪問1MB內存和運行在較高頻率,它比Intel的舊8位處理器性能快得多。線程
80186和80188(1980)設計
繼8086以後Intel發佈了一些使用類似架構的16位處理器。首先是80186處理器,設計用於緩解使用80186 CPU成品機的製造壓力。Intel將一些本來在主板上的硬件移到了CPU中,包括時鐘發生器,中斷控制器和計時器,經過集成這些部分,80186比8086快上許多,Intel也經過提升時鐘頻率來提高性能
80188一樣集成了部分硬件,可是像8088那樣總線被限制爲8位總線
80286:更多的內存 更好的性能(1982)
80286和80186於同年發佈,有着幾乎相同的特性,可是80286的地址總線擴展到了24位,使得最高能訪問16MB的內存
iAPX 432(1981)
iAPX 432是Intel對於偏離X86的不一樣設計的一種嘗試。Intel但願 iAPX 432性能可以更上一步,但由於一些設計上的缺陷,這款處理器最終以失敗了結。儘管X86處理器已經很複雜了,iAPX 432則將CISC複雜度更上一層。芯片的設計過於龐雜,迫使Intel不得不把它作成分離的兩片芯片。處理器對於數據吞吐的龐大需求導致帶寬不足而性能表現不佳。它比8080和8086表現要好,但不敵後續的X86處理器,最終被放棄
i960:Intel的RICS初嘗試(1984)
Intel在1984年推出了自家的第一款RICS(精簡指令集)處理器,但它並非設計與自家的X86處理器競爭,而是主要被用於嵌入式安全解決方案。它的內部設計基於BerkeleyRISC 32位超標量設計概念。最初的i960處理器頻率很是低,低速模式僅僅有10MHz,可是通過逐年改進和更先進的製程,它的最終頻率達到了100MHz。一樣支持4GB內存,被普遍應用於軍事系統和商業系統中
80386:X86的32位開端(1986)
Intel的第一款32位X86處理器是80386,於1985年發佈。其中最關鍵的特性就是採用了32位地址總線最大支持4GB內存,儘管這個數字比當時大多數人用的要大得多,但RAM的限制損害了早先X86處理器和它的競品的性能。與現代CPU不一樣的是,在80386時代,更多的RAM可以直接轉化爲性能的提高。Intel同時採用了一些架構改進來提高相同RAM大小的性能表現
爲了讓產品線在價格上更加友好,Intel發佈了80386SL,和32位的80386幾乎相同,不過限制了只能進行16位操做,不過它一樣支持最大4GB RAM,但只能運行16位應用
.i860(1989)
在1989年,Intel再次嘗試了非X86處理器,他們推出了全新的RICS處理器i860。不像早先的i960,此次的i860被設計用於直接在桌面級市場競爭,可是此次的設計問題繁多,它最明顯的缺陷是處理器的性能嚴重依賴於編譯器在軟件啓動時將指令編排好順序,這雖然幫助Intel將芯片尺寸縮小,複雜度下降,可是在編譯過程當中將指令從頭至尾正確排序幾乎是不可能的,最終致使了處理過程當中的高延遲
80486:整合浮點運算(1989)
80486是CPU性能史上的又一里程碑,它成功的關鍵在於在CPU中整合更多的元件。80486上第一次出現了一級緩存,早期的80486封裝了8KB緩存,使用1000nm製程。不過隨着製程發展到600nm,一級緩存增長到了16KB
此外,Intel還整合了FPU(浮點運算單元),在此以前一直做爲一個分離的處理單元。經過將FPU整合進CPU,它們之間的延遲大大下降。80486還使用了更快的FSB接口來提高帶寬和其它技術來提高性能。這些改進顯著提升了80486的性能。
最初的80486時鐘頻率爲50MHz,後來的採用600nm製程的型號達到了100MHz。在消費領域還發布了80486SX,移除了FPU部分
P5:最初的Pentium(奔騰)(1993)
最初的Pentium CPU在1993年發佈,但沒有沿用80X86的命名方式。Pentium採用了P5架構,這是Intel在X86 CPU首次採用超標量技術(注:這與咱們如今常提到的超線程技術不一樣),儘管全面超越了80486,但最突出的進步是改進了FPU。
最初的Pentium FPU性能達到80486的十倍,在接下來推出的Pentium MMX中這一特色更加顯著,它和最初的Pentium處理器架構相同,但新的MMX SIMD指令集令性能大幅提高
Intel一樣提高了一級緩存的大小,Pentium提高到16KB,Pentium MMX提高到32KB。固然頻率也在提高,最初的Pentium使用800nm製程,運行在60MHz,但在以後的版本中,採用250nm的Pentium達到了300MHz的頻率
P6架構:Pentium Pro(奔騰 Pro)(1995)
Intel計劃在Pentium以後迅速推出基於P6架構的Pentium Pro系列,可是遇到了技術問題。藉助於Out-of-Order(無序執行指令)設計,Pentium Pro的性能大大提升。最顯著的特性是其內部有一個將指令分解爲微指令的架構,隨後送到通用執行單元。此外還採用了典型的14級流水線結構
最初的目標是面向服務器市場,將地址總線提高至32位而且增長了PAE(物理地址擴展),使得最大能支持到64GB RAM,這遠超通常消費者的需求,但大容量內存支持對服務器市場來講很重要
緩存系統也獲得了改進,一級緩存使用在2片8KB高速緩存,一片存取指令,一片存取數據。爲了彌補和Pentium MMX 16KB緩存的差距,Intel採用了從256KB到1MB大小不等的二級緩存,以與CPU相連的單獨芯片形式封裝在CPU中,它與CPU經過BSB總線相連
Intel原來打算把Pentium Pro推向消費者市場,不過最終只在服務器市場銷售,Pentium Pro帶來了幾種革命性改進,可是表現難以在Pentium和Pentium MMX面前脫穎而出,後二者在16位操做下性能優異,而那時軟件市場仍是16位的天下,同時因爲缺少對於MMX指令集的支持,結果致使Pentium Pro在MMX指令集優化軟件下表現不佳
PentiumPro或許會在消費級市場站住腳,可是因爲分離的輔助芯片(包括二級緩存)致使造價依舊昂貴。最快的Pentium Pro處理器能達到200MHz,製造工藝爲500nm和350nm
P6架構: Pentium II(奔騰II)(1997-1999)
Intel沒有放棄P6架構,1997年Pentium II發佈。Pentium II幾乎一掃全部Pentium Pro的缺陷。它的底層架構和Pentium Pro類似,堅持使用14級流水線架構和一些加強核心來改善性能。一級緩存由16KB數據緩存和16KB指令緩存
Intel還選擇經過使用低價緩存芯片和更大的硅片封裝來下降成本,這兩種方法對於下降產品價格很是奏效,可是這些存儲模塊不能與CPU的速度相匹配,所以二級緩存只有一半的速率,在早期的CPU中這些方法對於提高性能異常有效
Intel同時增長了對於MMX指令集的支持,Pentium II使用的核心代號分別爲"Klamath"和 "Deschutes",同時也做爲Xeon和PentiumII Overdrive系列產品在服務器市場出售,最高端的型號擁有頻率450MHz容量512KB二級緩存
P6:Pentium III和1 GHz競賽(1999-2003)
Intel打算使用代號爲Netburst 架構的CPU來接替PentiumII ,可是事與願違,新架構處於難產。於是Intel繼續壓榨P6架構推出了Pentium III處理器
第一款產品代號爲Katmai,它與Pentium II很是類似,一樣使用了只有一半CPU時鐘頻率的二級緩存。底層架構包括了一些其餘的顯著變化, 14級流水線的一些部分被融合在一塊兒,縮短至10級流水線。得益於流水線的改進和時鐘頻率提升,Pentium III性能小幅度超越Pentium II
Katmai使用250nm工藝,可是隨着製造工藝演進到180nm,Intel得以大幅度提高Pentium III的性能。代號Coppermine的處理器將二級緩存集成到CPU,而且削減了一半容量(降至256KB),但由於與CPU保持同速,性能表現搶眼
Coppermine是Intel在1GHz大戰中面對AMD Athlon的競品,Intel成功地將頻率提高到1.13GHz,可是在隨後發現不能以此頻率穩定運行於是被召回了,這使得1GHz的型號成爲最快的Pentium III
最後的Pentium III核心代號爲Tualatin,採用130nm製程,頻率達到1.4GHz,二級緩存擴容至512KB,必定程度提升了性能
P5和P6架構 Celeron(賽揚)和Xeon(志強)
在發佈Pentium II的同時Intel也發佈了Celeron和Xeon系列,這系列產品和Pentium II或是以後的Pentium III擁有相同的核心,只是緩存大小不一樣。第一款基於PentiumII的賽揚處理器沒有二級緩存,結果性能表現糟糕。而基於Pentium III的賽揚處理器擁有對應產品的一半的緩存。結果是使用Coppermine核心的賽揚處理器只有128KB二級緩存,隨後的Tualatin核心產品增長到了256KB
這些一半緩存的衍生品被稱做Coppermine-128和Tualatin-256,Intel以媲美Pentium III的頻率售賣這些CPU,讓他們擁有良好的性能表現來和AMD的Duron處理器相對抗。例如微軟在Xbox遊戲機上使用的就是733MHz的Coppermine-128處理器
第一款Xeon處理器也很相似,不過擁有更大的二級緩存,基於PentiumII的Xeon處理器至少有512KB的緩存,高端型號能達到2MB
Netburst架構: Pentium 4 Willamette(威廉)和Northwood(北木)(2000-2004)
時間來到2000年,Intel的Netburst架構終於準備就緒,推向市場的產品就是Pentium 4,這樣的組合本該讓Intel在以後的6年裏在CPU市場獨領風騷。首先發布的是代號Willamette的產品,領跑Pentium 4最初的兩年。儘管新品在性能上勉強超過PentiumIII,但這段時間Intel麻煩不斷。Netburst 架構的特色是流水線長頻率高(注:堆了多達20級的流水線),Willamette的頻率高達2GHz,但1.4GHz的Pentium III在某些任務中表現居然優於Willamette處理器。結果這一時期AMD的Athlon處理器的良好表現使其獨領風騷
在高端領域Intel推出了超線程技術來改善多任務下的資源利用問題,那時的超線程技術不像如今Core i7那樣高效,但仍是可以在必定程度上提升性能
Willamette和Northwood一樣出如今Celeron和Xeon系列裏,像上代產品同樣,Intel經過調整二級緩存大小來區別性能
P6: Pentium-M(奔騰M)(2003-2008)
高性能的Netburst發熱量巨大,將其用於筆記本表現不佳。於是2003年Intel發佈了旗下第一次爲筆記本設計的專用架構。Pentium-M基於P6架構,採用12-14級可變流水線,這也是Intel第一款可變流水線長度處理器,意味着若是須要的數據已經讀取到緩存中,指令只需通過12級流水線就能夠執行完畢,若是沒有則再通過額外的2級流水線來讀取數據
首款處理器採用130nm工藝,包含1MB二級緩存。主頻達到1.8GHz而功耗只有24.5W。2004年發佈的名爲Dothan的後繼型號,採用90nm工藝,擁有2MB二級緩存和更多的輔助核心,改善了IPC。最終達到2.27GHz主頻和僅僅27W的功耗
Netburst: Prescott(2004-2008)
Northwood在2002年至2004年做爲Netburst 架構的主力,在這以後Intel發佈了Prescott架構帶來了巨大的提高,使用90nm工藝,二級緩存增至1MB,全新的LGA 775接口,支持DDR2內存,新的FSB。使得Prescott相較於northwood有了更大的帶寬,極大地提升了Netburst架構的性能。Prescott同時也是第一款64位X86 CPU,可以支持更大的RAM
Prescott本應是Intel處理器家族中的皇冠,可結果是慘敗。Intel再次狂堆至31級流水線(注:包括前端處理)Intel但願經過提升頻率來抵消長流水線的弊端,可是隻達到了3.8GHz。Prescott 發熱量巨大,功耗太高。Intel寄但願於90nm製程能解決這一問題,結果是增長的晶體管密度導致散熱更加困難。由於頻率沒有達到預期,Prescott的「革命性」改進成效
Netburst: Pentium D(奔騰D)(2005-2008)
2005年,雙核處理器之戰打響。AMD率先發布了本身的雙核產品Athlon 64,但只是畫了張大餅。Intel匆忙推出基於MCM( multi-coremodule)的雙核產品迎戰,並將其命名爲Pentium D,核心代號Smithfield
事與願違,Pentium D處理器飽受批評,由於它有着和Prescott同樣的問題。兩片基於Netburst架構的芯片發熱巨大、能耗驚人,頻率則最多隻有3.2GHz。由於帶寬上的不足,Smithfield的IPC性能大打折扣,而同時期AMD的單芯雙核處理器則很是成功
Smithfield的繼任者是Presler架構,採用新的65nm工藝,由兩片CederMill芯片封裝而成。改善了發熱和功耗,而且頻率提高至3.8GHz
Presler有兩點重要改進,一是將TDP從125W降至95W。二是歸功於更小的芯片尺寸,二級緩存幾乎翻了一倍,達到了2MB。一些發燒級型號使用了超線程技術,容許CPU同時執行4線程。
改頭換面:Core 2(2006-2011)
Intel最終放棄了Netburst架構轉而採用和P六、Pentium-M相似的設計。他們終於意識到P6的設計是高效可行的。Intel從新設計了核心架構,新架構採用14級流水,明顯比Prescott的31級要少得多
Core 2系列具備很高的可擴展性,Intel推出了從TDP只有5W的移動型號到130W的高端型號,其中Intel售出的大部分是Core 2 Duo(雙核)和Core 2 Quad(四核)的產品,不過也有Core Solo、Celeron,Pentium和Xeon系列產品。四核產品是將兩個單芯雙核芯片封裝在一塊兒,單核產品則由雙核屏蔽而成,配置的二級緩存從512KB到12MB不等
隨着核心架構的改進,Intel終於能夠與AMD一較高下,PC DIY市場也進入了新的黃金時代
Bonnell架構: Silverthorne 和Diamondville(2008)
Core 2處理器廣受歡迎,但Intel須要一些價格低廉的產品來攻佔低端市場,因而Atom誕生了。芯片大小僅有26平方毫米,不及Core 2的四分之一
Intel並無選擇徹底從新設計Atom Bonnell架構,而是選擇藉助P5架構的基礎。第一款Atom芯片,核心代號Silverthorne,TDP僅有3W,讓它可以在沒法使用Core 2的地方發揮功用。Silverthrone的IPC性能毫無亮點,不過仍是可以達到2.13GHz頻率。配有512KB二級緩存,不過這二者對於彌補較低的IPC沒有太大幫助。不過Silverthrone的低價仍是物有所值
接替Sliverthorne的是Diamondville,頻率下降至1.67GHz,增長64位支持,改善了面對64位軟件的性能表現
.Nehalem:第一款Core i7(2008)
隨着高端處理器市場的競爭白熱化,Intel決心不能坐以待斃。他們從新設計了Nehalem架構。包括從新設計的緩存控制器,每核心二級緩存降至256KB,增長4-12MB不等的三級緩存(全部核心共享)。Nehalem產品線包括單核到四核,採用45nm工藝
Intel還從新設計CPU和系統其它部分的總線,從19世紀80年代起一直採用的FSB總線終於壽終正寢,取而代之的的是全新的QPI和DMI。Intel同時將內存控制器和PCIe控制器一併集成到了CPU中,這項舉措增長了帶寬的同時下降了延遲
Intel再一次增長了處理器的流水線,此次是20-24浮動,頻率沒有任何提高。同時也是Intel第一款採用睿頻技術的處理器。儘管最高頻率是3.33GHz,不過能夠短時運行在3.6GHz。
最後一項主要特性是Nehalem標誌着超線程技術的迴歸,得益於這項技術和其它改進,Nehalem與Core 2相比在滿負載狀況下性能最高能提升一倍
Bonnell:Pineview和Cedarview(2009)
2009年,Intel發佈了兩款新的基於Bonnell架構的Atom處理器。第一款代號爲Pineview,依舊採用45nm製程,採用集成部分原屬於主板的組件的方法來提高性能,包括集成顯卡和內存控制器,而且下降了功耗和發熱。使用MCM(Multi-Chip Module)技術的雙Pineview核心版本也有發售
.Westmere:核顯的開端(2010)
Intel使用32nm工藝重作了Nehalem並命名爲Westmere,它的底層架構沒有太多變化,可是經過製程帶來的進步,Intel能夠在CPU中塞下更多的東西,Westere堆至10核心以及多達30MB的三級緩存
集成在其中的核顯架構相似GMA 4500,除了前者多出了兩個EU,頻率從低端CPU的166MHz到高端CPU的900MHz
儘管32nm的CPU和45nm的北橋沒有徹底融合在一塊兒,不過仍是封裝在一塊基板上,這有助於減低CPU和北橋中的內存控制器的通訊延遲。API的支持上和GMA系列沒有太大變化,可是性能提升了50%
Sandy Bridge(2011)
SandyBridge架構完成了性能上的巨大飛躍,流水線從新縮減爲14-19級,採用了新的微指令緩存可以存儲至多1500條微指令,當微指令所有進入緩存時能夠繞過多出的5級流水,如若沒有則執行完整的19級流水
此外還有一些其餘改進,包括支持DDR3內存,更多的組件集成到CPU中,全部部分集成在一個芯片中,這些子系統由一條高帶寬的總線鏈接在一塊兒
此外還更新了核顯,改變了上代產品一款核顯打天下的思路,此次發佈了三種型號的核顯,最高端的是12EU的HD Graphics 3000,時鐘頻率可達1.35GHz。中端型號爲HDGraphics 2000,縮至6EU。低端型號也是6EU,但閹割了一些額外功能
Bonnell: Cedarview(2011)
2011年Intel發佈新的Atom處理器,經過縮小核心來改善IPC性能,但事實上收效甚微
Cedarview的兩項重大舉措就是採用32nm工藝和頻率提高至2.13GHz,同時得益於改進後的內存控制器,能夠支持頻率更高的DDR3內存
Ivy Bridge(2012)
Sandy Bridge產品的後繼者是Ivy Bridge系列產品,是Intel Tick-Tock戰略中的Tick+產品。IvyBridge的IPC性能僅比SandyBridge好上一點,可是帶來了一些其餘的亮點
Ivy Bridge最大的亮點是能耗,採用22nm的工藝下降了發熱,上代i7產品的典型TDP爲95W,而這代產品降至77W。這對於移動端意義非凡,使得移動端四核CPU僅有35W的TDP,而此前移動端四核CPU的TDP爲45W
.Haswell(2013)
Intel在IvyBridge發佈後僅一年發佈了新的Haswell架構,此次僅僅能算上是進步而不是革新。AMD此時在高端產品沒法與Intel抗衡,因此Intel繼續擠牙膏,Haswell與Ivy Bridge相比僅提升10%左右
和IvyBridge系列相似,Haswell最大的吸引力在於能耗和iGPU,Hsawell在CPU中集成了電壓管理模塊,使CPU可以有更好的能耗表現,但問題是電壓管理模塊致使CPU發熱更大
與此同時爲了與AMD的APU抗衡,Intel在高端iGPU中集成了40組EU,同時經過增長128MB L4 eDRAM緩存,大幅提升iGPU性能
Broadwell(2014)
Intel的下一代架構的核心代號爲Broadwell,採用14nm製程,爲移動端而設計,於2014年發佈。首個Broadwell產品是Core M,雙核超線程CPU,TDP僅有3-6W
可是在桌面市場,幾乎難見Broadwell的身影,僅在2015年中期發佈寥寥幾款產品,但集成了Intel史上最強核顯,包括48組EU單元,128MB L4 eDRAM緩存,解決了核顯的帶寬問題,在遊戲性能的測試中,表現優於AMD最快的APU
Skylake(2015)
在Broadwell桌面端發佈後不久,Intel發佈了下一代產品Skylake架構,儘管這是Intel至今最強的CPU,不過平臺的變化能夠說比CPU自己更重要
首先是支持DDR4內存,可以比DDR3內存提升更高的帶寬,還有全新的DMI 3.0總線,升級的PCIe控制器和支持更多的設備鏈接
同時iGPU也獲得了升級,最高端型號爲Iris Pro Graphics 580(Skylake-R系列),包含72組EU和128 MB L4 eDRAM緩存,但大部分CPU搭載的是包含24組EU的核顯,其架構與上代Broad架構類似