版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-微處理機芯片

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

基本概念

自從1971年Intel公司推出第一片微處理器芯片4004、尤其是1974年推出8位微處理機芯片8080以后,摩爾定律(即集成電路的集成度,性能大約每18個月翻一番)就開始。從90年代初開始,國際上采用主流的微處理機芯片研制高性能并行計算機已成為一種發(fā)展趨勢。

微處理機(又稱為CPU或中央處理單元)是裝配在單顆芯片上的一個完整的計算引擎。微處理機能完成取指令、執(zhí)行指令,以及與外界存儲器和邏輯部件交換信息等操作,是微型計算機的運算控制部分。它可與存儲器和外圍電路芯片組成微型計算機。

微處理機芯片結(jié)構(gòu)微處理器基本結(jié)構(gòu)如圖:

這是一個進行了最大程度簡化的微處理器。此微處理器具有:

(1)一條地址總線(總線寬度可以8位、16位或32位),用于向內(nèi)存發(fā)送一個地址;

(2)一條數(shù)據(jù)總線(總線寬度可以是8位、16位或32位),能夠?qū)?shù)據(jù)發(fā)送到內(nèi)存或從內(nèi)存取得數(shù)據(jù);

(3)一條RD(讀)和WR(寫)線路,告訴內(nèi)存它是希望寫入某個地址位置還是獲得某個地址位置的內(nèi)容;

(4)一條時鐘線路,將時鐘脈沖序列發(fā)送到處理器;

(5)復(fù)位線路,用于將程序計數(shù)器重置為零(或者其他內(nèi)容)并重新開始執(zhí)行。

微處理器執(zhí)行一組機器指令,這組指令可向處理器告知應(yīng)執(zhí)行哪些操作。微處理器就會根據(jù)指令執(zhí)行三種基本工作:

(1)通過使用ALU(算術(shù)/邏輯單元),微處理器可以執(zhí)行數(shù)學(xué)計算。例如:加法、減法、乘法和除法?,F(xiàn)代的微處理器包含完整的浮點處理器,它可以對很大的浮點數(shù)執(zhí)行非常復(fù)雜的浮點運算。 ?

(2)微處理器可以將數(shù)據(jù)從一個內(nèi)存位置移動到另一個位置。 ?

(3)微處理器可以做出決定,并根據(jù)這些決定跳轉(zhuǎn)到一組新指令。

微處理器能夠執(zhí)行許多非常復(fù)雜的工作,但是所有工作都屬于這三種基本操作的范疇。

微處理機芯片器的發(fā)展CISC微處理器這種計算機為復(fù)雜指令系統(tǒng)計算機,簡稱CISC。這種計算機采用的微處理器屬于CISC結(jié)構(gòu)的微處理器。在CISC微處理器中,程序的各條指令是按順序串行執(zhí)行的;每條指令中的各個操作也是按順序串行執(zhí)行的。順序執(zhí)行的優(yōu)點是控制簡單,但機器各部分的利用率不高,執(zhí)行速度慢。Intel的80386系列就屬于CISC結(jié)構(gòu)的微處理器。

對CISC機進行測試表明,各種指令的使用頻度相當(dāng)懸殊,最常使用的是一些比較簡單的指令,它們僅占指令總數(shù)的20%,但在程序中出現(xiàn)的頻度卻占80%。復(fù)雜的指令系統(tǒng)必然增加微處理器的復(fù)雜性,使微處理器研制時間長、成本高。復(fù)雜指令需要復(fù)雜的操作,從而降低了機器的速度。

RISC微處理器70年代末,John Cocke提出精簡指令的想法。80年代初斯坦福大學(xué)研制出MIPS機,為精簡指令系統(tǒng)計算機(簡稱RISC)的誕生與發(fā)展起了很大作用。RISC機中采用的微處理器統(tǒng)稱RISC處理器。MIPS R3000,HP-PA8000系列,Motorola M88000等均屬于RISC微處理器。它們的指令數(shù)目只有幾十條。RISC微處理器不僅精簡了指令系統(tǒng),還采用超標(biāo)量和超流水線結(jié)構(gòu),大大增強了并行處理能力,并在構(gòu)建并行精簡指令系統(tǒng)多處理機中起著核心的作用。由于RISC處理器指令簡單、采用硬布線控制邏輯、處理能力強、速度快,世界上絕大部分UNIX工作站和服務(wù)器廠商均采用RISC芯片作CPU用。這些RISC芯片的時鐘頻率低,功率消耗少,溫升也少,機器不易發(fā)生故障和老化,提高了系統(tǒng)的可靠性。

EPIC微處理器何謂64位計算機?現(xiàn)今工業(yè)界對64位計算機的描述,是指具有64位運算能力、64位尋址空間和64位數(shù)據(jù)通路的計算機。

64位的硬件環(huán)境能提供的好處:

(1)64位的CPU和數(shù)據(jù)通路,可以提供快速雙精度的運算能力;

(2)64位的指針可以提供大于1TB的虛擬存儲空間,文件長度可以大于1TB;
(3)物理地址空間大于1TB。

64位CPU可以快速而精確地執(zhí)行應(yīng)用程序,允許程序人員在設(shè)計程序時可以使用比以往更大的數(shù)據(jù)庫和存儲空間,可以處理很復(fù)雜的計算模型。簡單地說,EPIC處理器首先由編譯程序分析指令之間的依賴關(guān)系;然后將沒有依賴關(guān)系的指令組合成群;最后由內(nèi)置的執(zhí)行單元讀入指令群并分頭并行執(zhí)行。由于各條指令究竟分配給哪個單元是由編譯器來決定的,而不是由硬件進行調(diào)度,因此降低了處理器的制造成本。

Intel的Intanium(安騰)處理器和AMD的Athlon(速龍)處理器均屬于64位的EPIC微處理器,兩者均采用0.18微米的CMOS制造工藝。不同的是IA- 64的奔騰處理器與IA-32應(yīng)用程序不能完全兼容,而AMD的x86- 64可以運行IA-32的應(yīng)用程序。因此在64位的EPIC處理器戰(zhàn)場上,Intel和AMD兩大廠商展開了激烈的競爭。

Alpha處理器Alpha的設(shè)計思想可以用一句話來概括:一個聰明的編譯程序和一個聰明的處理器開發(fā)Alpha體系結(jié)構(gòu)的明顯目標(biāo)是實現(xiàn)在編譯程序、處理器體系結(jié)構(gòu)和實際線路設(shè)計等方面都能夠創(chuàng)造性地提高性能。Alpha設(shè)計成能夠利用編譯時和運行時的信息。當(dāng)編譯出錯時,設(shè)計了一個無序指令發(fā)送機制使得計算機能夠適應(yīng)程序的運行過程而不是阻塞計算機的運行。此外,編譯程序在程序中只有有限的視野,經(jīng)常不能跨過子程序或模塊的邊界進行優(yōu)化。同時多線程允許Alpha處理器除了指令級并行外還能夠利用線程級并行。Alpha是為廣泛范圍的商業(yè)應(yīng)用設(shè)計的。同時,多線程是Alpha無序指令執(zhí)行的自然擴展,它也是在大多數(shù)應(yīng)用負載下利用顯性并行的最有效機制。

MIPS處理器MIPS 84000是最早推出的64位處理器之一。SGI在收購MIPS(后MIPS又獨立)之后繼續(xù)發(fā)展T系列的64位處理器,先后推出了R6000,R8000,R10000,R12000等型號。

MIPS 812000是超標(biāo)量的RISC微處理器,它采用ANDES(無序動態(tài)執(zhí)行和調(diào)度)的體系結(jié)構(gòu)。在每個流水線周期內(nèi)可對4條指令進行譯碼。該微處理器有5條執(zhí)行流水線分別連接到整數(shù)和浮點執(zhí)行單元,并具有推理機制及無序動態(tài)執(zhí)行機制。

H2是一種設(shè)計用于滿足用戶在今后十年使用的最苛求的技術(shù)和商業(yè)計算應(yīng)用需要的新型微處理器系列。利用在處理單和多處理器環(huán)境中迅速將大數(shù)據(jù)集合從CPU輸出和輸入到CPU的技術(shù),這種微處理器系列集成了消除處理器與系統(tǒng)設(shè)計之間存在的傳統(tǒng)瓶頸的創(chuàng)新內(nèi)存。在保持編碼和指令集兼容性的同時,H2將為大型可伸縮服務(wù)器級計算機到桌面系統(tǒng)提供動力。

微處理器芯片的新發(fā)展過去的微處理器主頻大多比較低,不斷提高主頻、降低線寬、采用超流水、多發(fā)射等技術(shù)是提高處理器性能的主要設(shè)計方法,處理器主頻高低幾乎成為微處理器性能強弱的代名詞。隨著主頻持續(xù)增長在物理設(shè)計上出現(xiàn)了一些困難。特別是處理器性能增長速度遠低于處理器主頻的增長速度。以Intel公司微處理器發(fā)展歷史為例,從I486發(fā)展到Pentium 4,處理器主頻增長了15倍,但性能才提高5倍。另外傳統(tǒng)的提高性能方法易導(dǎo)致芯片面積增大、功耗過大、晶體管數(shù)量過多等一系列問題。隨著處理器設(shè)計技術(shù)和生產(chǎn)工藝的發(fā)展,處理器突破性的性能提升還必須依賴處理器的結(jié)構(gòu)更新。

2001年以后微處理器微系統(tǒng)結(jié)構(gòu)設(shè)計中出現(xiàn)了一些令人矚目的新變化。如主頻的增長不再符合摩爾定律,主頻高低不再是最關(guān)鍵的處理器性能評價指標(biāo),線程級并行變得更普遍,64位計算正在向低端用戶普及、支持無線上網(wǎng)且低功耗的處理器成為筆記本電腦的主流。新技術(shù)的原理是什么?如何實現(xiàn)?是什么原因?qū)е乱捎眯录夹g(shù)而不是傳統(tǒng)的微系統(tǒng)結(jié)構(gòu)技術(shù)?以上問題應(yīng)從技術(shù)和應(yīng)用需求等多個角度進行考察,主頻增長困難的前提下,確保微處理器性能繼續(xù)提高的新技術(shù)進行考察,對新技術(shù)的原理、效果、必要性以及應(yīng)用需求進行介紹和分析。

追隨CISC還是轉(zhuǎn)向RISCRISC(全稱Reduced Instruction Set Computer,精簡指令系統(tǒng)計算機)是一套優(yōu)化過的指令架構(gòu),它是根據(jù)著名的80/20法則所訂立。計算機科學(xué)家們發(fā)現(xiàn),計算機中80%的任務(wù)只是動用了大約20%的指令,而剩下20%的任務(wù)才有機會使用到其他80%的指令。如果對指令系統(tǒng)作相應(yīng)的優(yōu)化,就可以從根本上快速提高處理器的執(zhí)行率。

IBM公司在1975年成功開發(fā)出第一款RISC處理器,從此RISC架構(gòu)開始走進超級計算機中。由于指令高度簡約,RISC處理器的晶體管規(guī)模普遍都很小而性能強大,深受超級計算機廠商所青睞。

無論在執(zhí)行效率、芯片功耗還是制造成本上,選擇RISC都比沿用X86更加英明。在工藝相同的情況下,芯片面積大小取決于所集成的晶體管規(guī)模。RISC處理器核心精簡、效率更高,只要很少的晶體管就能達到與X86產(chǎn)品媲美的效能,制造成本可大大低于現(xiàn)有的X86處理器。而小晶體管規(guī)模亦有助于保持較低的能耗值,RISC處理器在這方面表現(xiàn)相當(dāng)杰出,現(xiàn)在的嵌入式設(shè)備幾乎都采用RISC產(chǎn)品,原因就在于這類產(chǎn)品的功耗值超低。

PARROT基于RISC思想Intel在IDF技術(shù)峰會上提出的”PARROT'概念便充分體現(xiàn)了這種思想。PARROT的全稱是“Power Awareness through Selective Dynamically Optimized Traces”,從其名稱不難得知,PARROT是一項借助”動態(tài)優(yōu)化執(zhí)行路徑”來提高處理器執(zhí)行效率的技術(shù)。它的理論基礎(chǔ)也是著名的80/20法則,但與RISC不同,X86處理器無法從指令系統(tǒng)層面上實現(xiàn)這一點。Intel另辟蹊徑,提出了一個全新的發(fā)展思路,將20%的常用指令定義為“熱代碼(Hot Code)”,剩余的80%指令使用頻率沒那么高,被定義為“冷代碼(Cold Code) ”。對應(yīng)的CPU也在邏輯上被劃分為兩個部分:一是熱核(Hot印ot),只針對調(diào)用到熱代碼的程序;另一部分則是冷核(Cold Spot),負責(zé)執(zhí)行20%的次常用任務(wù)。由于熱核部分要執(zhí)行80%的任務(wù),設(shè)計者便可以將它設(shè)計得較為強大,占據(jù)更多的晶體管資源。而冷核部分任務(wù)相對簡單,沒有必要在它身上花費同樣的功夫。

“PARROT”創(chuàng)造了一種嶄新的雙核概念,過去我們談?wù)摰碾p核心是橫向維度的對等設(shè)計。而PARROT則是一種縱向維度的雙核理念,熱核與冷核地位并不對等,且無法獨立運作,只能說是一個CPU內(nèi)核中的兩部分分立邏輯。它所起到的是提高CPU的硬件資源利用率,以高執(zhí)行效率達到高效能的目的,這種做法顯然比目前業(yè)界鼓吹的“雙核心”更具革命意義。

PARROT的新奇思路令人耳目一新,通過對執(zhí)行單元的結(jié)構(gòu)性優(yōu)化,X86處理器可以說是獲得了重生。設(shè)計者可以對“熱核”部分進行大大強化,使之擁有更高的效能,在執(zhí)行多數(shù)任務(wù)時用戶都可感覺到立竿見影的性能提升,而對于冷核的必要壓縮則大幅度節(jié)省了晶體管資源,并可達到明顯降低芯片功耗的目的。設(shè)計者可以在晶體管規(guī)模不變的前提下,讓X86處理器獲得數(shù)倍的效能提升。毫無疑問,X86處理器將因此出現(xiàn)跨越性的技術(shù)進步。而換個角度看,PARROT完全可以說是RISC思想的偉大勝利,80/20法則再度成為魔法的關(guān)鍵。據(jù)悉,PARROT技術(shù)將在2007年開始進入實用,"Merom”將成為首款基于PARROT思想的處理器內(nèi)核。大家一定看過這樣的新聞:2007年Intel的服務(wù)器處理器、桌面處理器和移動處理器都將采用“Merom”內(nèi)核,無論性能還是功耗都將有出色的表現(xiàn),我們有足夠的理由對它寄以厚望。

分布式計算思想分布式計算的核心思想很簡單:讓整個網(wǎng)絡(luò)的計算機系統(tǒng)聯(lián)結(jié)為一體,使之可以用共同的計算力來執(zhí)行同一個任務(wù)。分布計算網(wǎng)絡(luò)內(nèi)的計算機數(shù)量越多,該網(wǎng)絡(luò)所擁有的計算力就越強大。

我們知道,PC的功能一直都在不斷延伸,所面對的任務(wù)也變得越來越復(fù)雜,而硬件技術(shù)的發(fā)展似乎永遠不夠一往往在你驚嘆某款X86處理器多快多快的時候,一項新出現(xiàn)的大型應(yīng)用就足以讓它捉襟見肘,例如,將DVD壓縮成DIVX、編輯高分辨率的復(fù)雜圖像、JD環(huán)境渲染生成、大文件壓縮和解壓、HDTV編解碼、大型JD游戲等等,一般的PC很難勝任這些任務(wù),但如果處理器可直接支持分布式計算,問題便迎刃而解了。借助分布計算網(wǎng)絡(luò),每一臺計算機都有了強大的后盾,參與運算工作的并非只有本機,而是整個計算機網(wǎng)絡(luò),即便本機的性能不高,照樣可以很輕松完成高度復(fù)雜的任務(wù)。而計算網(wǎng)絡(luò)的規(guī)模越龐大,所具有的計算力就越可觀,相信這不論對于大中型企業(yè)客戶,還是普通家庭用戶都有非常積極的意義。

讓PC同步執(zhí)行兩套系統(tǒng)在以往,這種多操作系統(tǒng)技術(shù)僅限于超級計算機領(lǐng)域,但Intel決定讓PC也擁有同樣的功能,并發(fā)展出一套名為“Van-derpool”的技術(shù)。要在同一個硬件平臺上同時生成兩套操作環(huán)境并不容易,Vanderpool如何解決二者可能存在的沖突問題?Intel引入了一項名為“VMM (virtual machine monitor,虛擬機監(jiān)控器)”的技術(shù)解決了問題。首先,Vanderpool在硬件平臺上分別構(gòu)建了隔絕的邏輯區(qū),每個邏輯區(qū)都包含完整的運作狀態(tài),它們包括處理器的運算資源和內(nèi)存資源;其次,VMM可對處理器、內(nèi)存和其他硬件資源進行統(tǒng)一的管理和分配,確保每個操作環(huán)境都可以獲得相應(yīng)的計算資源,由此保證多個操作環(huán)境同步運作。這樣在用戶看來,他所面對的就是兩套同步運行,且完全獨立的操作環(huán)境。而常規(guī)的計算機系統(tǒng)只有三層邏輯結(jié)構(gòu),自上而下分別是應(yīng)用軟件、操作系統(tǒng)和底層硬件,未有起銜接作用的”虛擬機”層。

更有效地利用能源功耗過高可以說是目前X86處理器所遇到的最大問題。Pre Scott核心的Pentium 4處理器功耗突破100瓦大關(guān),而Pentium 4 600系列更將達到130瓦的驚人水平,這不僅僅意味著大量的能源消耗,系統(tǒng)穩(wěn)定性也成問題。

然而,CPU所消耗的這些能源絕大多數(shù)都沒有得到利用,其有效利用率竟然只有0.1%的低水平。在去年2月份召開的“國際固態(tài)電路年會”上,與會專家對此問題提出許多積極的意見。

其中,東京大學(xué)的Takayasau Sakurai在會上發(fā)表一項電壓和頻率縮放技術(shù),該技術(shù)可根據(jù)軟件的負載情況來直接調(diào)整晶體管的閡值電壓,如果系統(tǒng)執(zhí)行的是需要大量計算的任務(wù),處理器便會以最快的時鐘頻率和最高的電壓運行。如果該技術(shù)能被未來的微處理器所采納,能源浪費現(xiàn)象將可得到很大程度的緩解。

全美達公司的技術(shù)總監(jiān)戴維也在大力推銷自己的LongRun2節(jié)能技術(shù),除了繼承上一代技術(shù)的動態(tài)調(diào)節(jié)電壓/頻率特性外,LongRun2最主要的新特性就是可對晶體管漏電流進行有效的控制。隨著半導(dǎo)體制造工藝的升級,晶體管線寬變得越來越小,各邏輯門間的障壁也越來越薄,漏電流現(xiàn)象就變得越發(fā)難以控制。90納米Pre Scott核心的功耗過高、漏電流是一個很重要的因素,這也是半導(dǎo)體業(yè)界所面臨的共同難題。而全美達的LongRun2技術(shù)卻從芯片設(shè)計角度上很好解決了這個問題1。