由來
多顯卡并行機(jī)制的歷史最早可以追溯到1997年,當(dāng)時(shí)的顯卡市場可以說是3Dfx一家獨(dú)大,該公司在1996年下半年所推出的Voodoo加速卡成為發(fā)燒友瘋狂追捧的一代經(jīng)典產(chǎn)品。1998年初,3Dfx推出了它們的第二代3D圖形卡產(chǎn)品—Voodoo 2,當(dāng)時(shí)Voodoo 2擁有90Mps的像素填充率,具備Z-Buffering、Anti-Aliasing、單周期雙紋理等當(dāng)時(shí)最先進(jìn)的3D特性,大幅超越其上一代產(chǎn)品,其他對(duì)手更是被遠(yuǎn)遠(yuǎn)甩在了后頭。不過,最令發(fā)燒友瘋狂的是Voodoo 2所具有的“SLI交錯(cuò)互連技術(shù)”,這項(xiàng)技術(shù)可以讓兩塊Voodoo 2顯卡連接起來并行運(yùn)作,獲得近乎翻倍的3D效能。如此一來,其他競爭者更是望塵莫及。
Sli的運(yùn)行
我們知道,CPU的并行運(yùn)作是通過指令并行執(zhí)行獲得的,但對(duì)顯卡來說情況有所區(qū)別。顯卡最終生成的是所渲染的3D畫面,這項(xiàng)工作包含大量的指令,而如何將工作均等分配就成為問題,3Dfx選擇了按畫面幀線進(jìn)行渲染的方式。SLI技術(shù)將一幅渲染的畫面分為一條條掃描幀線(Scanline),若Voodoo 2采用雙顯卡運(yùn)行模式,那么就由一個(gè)顯卡負(fù)責(zé)渲染畫面的奇數(shù)幀線部分,另一塊顯卡渲染偶數(shù)幀線,然后將同時(shí)渲染完畢的幀線進(jìn)行合并后寫入到幀緩沖中,接下來顯示器就可以顯示出一個(gè)完整的渲染畫面。不難看出,SLI技術(shù)讓渲染工作被平均分擔(dān),每塊顯卡只需要完成1/2的工作量。理論上說,渲染效率自然也可以提高1倍,這就是雙顯卡并行大幅提升效能的奧秘所在。SLI在技術(shù)上極為成功,而發(fā)燒友們對(duì)Voodoo 2也抱有莫大的熱情。在當(dāng)時(shí),你如果希望在1080p的“高分辨率”下流暢地玩3D游戲,唯一的解決方案就是使用兩塊Voodoo 2顯卡并讓它們工作在SLI模式下。
原理
在Voodoo 2之后的Voodoo 3,3Dfx沒有效仿這個(gè)SLI雙顯卡技術(shù),但在Voodoo 4/5/6時(shí)代,3Dfx重新恢復(fù)了SLI,但應(yīng)用的形式已有所區(qū)別。Voodoo 2倡導(dǎo)雙顯卡并行運(yùn)作,兩塊顯卡插在PCI槽里再用專用的線纜連接起來,但這并非必需的,單個(gè)Voodoo 2顯卡也可以獨(dú)自工作,只是速度較慢而已。2000年春,3Dfx推出VSA100圖形芯片,當(dāng)時(shí)nVIDIA已經(jīng)壓過3Dfx成為領(lǐng)先者,為了奪回自己的領(lǐng)導(dǎo)地位,3Dfx讓SLI技術(shù)重裝上陣。VSA100可支持單芯片、雙芯片和四芯片并行運(yùn)作,單芯片版本就是Voodoo 4,雙芯片顯卡為Voodoo 5 5500,而四芯片顯卡則是著名的Voodoo 5 6000。此時(shí),SLI技術(shù)演變?yōu)閱物@卡多圖形芯片的形式,不需占用兩個(gè)插槽,但內(nèi)部的工作機(jī)制并沒有發(fā)生多大的變化,依然是通過劃分渲染幀的方式各自執(zhí)行,然后在幀緩沖中統(tǒng)一合成。出于眾所周知的原因,這些顯卡都沒獲得廣泛認(rèn)可,3Dfx也從衰落走向死亡。2001年初,nVIDIA收購了3Dfx,SLI技術(shù)也隨之成為了歷史,盡管nVIDIA掌握了3Dfx的所有技術(shù),但它并沒有將之發(fā)揚(yáng)光大,而是繼續(xù)按照自己的道路走下去,收購3Dfx的目的也許只是消滅一個(gè)競爭對(duì)手而已。
在這之后,我們看到了nVIDIA順利一統(tǒng)江湖,接著就是ATi逐漸發(fā)起挑戰(zhàn),GeForce和Radeon是人們最常掛在嘴邊的名詞,至于3Dfx和它的SLI已經(jīng)逐漸被人淡忘了,即便偶爾有人談起,也多是說那是一個(gè)策略糟糕的企業(yè)和一項(xiàng)昂貴不切實(shí)際的技術(shù)。在顯卡的歷史中,除了Voodoo 2之外沒有哪一項(xiàng)多顯卡、多芯片技術(shù)曾獲得成功,雖然ATi嘗試過,新生的XGI也勇闖該領(lǐng)域,然而事實(shí)證明這個(gè)方案并不受用戶們的歡迎。不過,誰也沒有想到nVIDIA重新拾起3Dfx的SLI技術(shù)。2004年6月29日,nVIDIA大張旗鼓發(fā)布了“SLI Multi-GPU技術(shù)”,并將該技術(shù)引入最新發(fā)布的GeForce 6800和Quadro FX4000系列顯卡上。沿用“SLI”這個(gè)名稱或多或少讓人聯(lián)想到3Dfx,nVIDIA想要的也許正是這個(gè)效果,它更希望被用戶認(rèn)為是3Dfx技術(shù)的一脈相承。但如果我們深入分析,便會(huì)發(fā)現(xiàn)它與3Dfx的SLI技術(shù)沒有多少相同的地方,基本上就是一套nVIDIA新搞出來的多顯卡方案。
nVIDIA的SLI技術(shù)與早先3dfx的SLI雖然縮寫相同,其實(shí)已經(jīng)是全新的技術(shù),不但工作原理不同,甚至名稱都不相同,3dfx的SLI(Scan Line Interleave,雙掃描線交錯(cuò)技術(shù))是將畫面分為一條條掃描幀線(Scanline),兩塊顯卡對(duì)奇數(shù)幀線和偶數(shù)幀線分別渲染,然后將同時(shí)渲染完畢的幀線進(jìn)行合并后寫入到幀緩沖中,接下來顯示器就可以顯示出一幅完整的畫面。而nVIDIA的SLI則有兩種渲染模式:分割幀渲染模式(Scissor Frame Rendering,SFR)和交替幀渲染模式(Alternate Frame Rendering,AFR),分割幀渲染模式是將每幀畫面劃分為上下兩個(gè)部分,主顯卡完成上部分畫面渲染,副顯卡則完成下半部分的畫面渲染,然后副顯卡將渲染完畢的畫面?zhèn)鬏斀o主顯卡,主顯卡再將它與自己渲染的上半部分畫面合成為一幅完整的畫面;而交替幀渲染模式則是一塊顯卡負(fù)責(zé)渲染奇數(shù)幀畫面,而另外一塊顯卡則負(fù)責(zé)渲染偶數(shù)幀畫面,二者交替渲染,在這種模式下,兩塊顯卡實(shí)際上都是渲染的完整的畫面,此時(shí)并不需要連接顯示器的主顯卡做畫面合成工作。
在SLI狀態(tài)下,特別是在分割幀渲染模式下,兩塊顯卡并不是對(duì)等的,在運(yùn)行工作中,一塊顯卡做為主卡(Master),另一塊做為副卡(Slave),其中主卡負(fù)責(zé)任務(wù)指派、渲染、后期合成、輸出等運(yùn)算和控制工作,而副卡只是接收來自主卡的任務(wù)進(jìn)行相關(guān)處理,然后將結(jié)果傳回主卡進(jìn)行合成然后輸出到顯示器。由于主顯卡除了要完成自己的渲染任務(wù)之外,還要額外擔(dān)負(fù)副顯卡所傳回信號(hào)的合成工作,所以其工作量要比副顯卡大得多。另外,在SLI模式下,就只能連接一臺(tái)顯示器,并不能支持多頭顯示。
發(fā)展
SLI技術(shù)也在不斷的發(fā)展,最初對(duì)平臺(tái)硬件有許多限制,例如必須使用完全一樣的顯卡(同一個(gè)廠家同一個(gè)型號(hào)的顯卡,甚至顯卡BIOS也必須相同),而且在兩塊顯卡之間還必須使用SLI橋接器,支持SLI的也只有Geforce 6800 Ultra/6800 GT和6600GT三款顯示芯片等等。2006年以來組建SLI則可以使用不同廠家的采用相同顯示芯片的顯卡,低速顯卡可以不必使用SLI橋接器的時(shí)代已經(jīng)過去,從2008年至今,所有的英偉達(dá)顯卡想要實(shí)現(xiàn)SLI技術(shù)都必須通過橋接器進(jìn)行連接,導(dǎo)致該現(xiàn)象的原因在于游戲質(zhì)量的提升,顯卡性能的加強(qiáng)都對(duì)總線帶寬有更大的需求額,只有通過橋接器交換數(shù)據(jù),才不會(huì)造成總線的超負(fù)荷。,支持SLI的顯示芯片也擴(kuò)大到了所有GTX系列,不過,由于各個(gè)主板的兩個(gè)PCI-E插槽的間距不是固定的,因此不同主板的SLI橋接器一般是不能替換的(中高端主板的PCI-E接口間距一般相同,也就是可以替換)。
實(shí)際性能
SLI技術(shù)理論上能把圖形處理能力提高一倍,在實(shí)際應(yīng)用中,除了極少數(shù)測試之外,在實(shí)際游戲中圖形性能只能提高80%左右,在某些情況下甚至根本沒有性能提高,而能良好支持SLI的游戲還不太多。當(dāng)然,隨著驅(qū)動(dòng)程序的完善,SLI的實(shí)用性逐步提高。因?yàn)椴恢С諷LI的游戲往往一張顯卡就足以應(yīng)付,對(duì)系統(tǒng)性能高的游戲/程序則往往支持SLI。
使用兩塊顯卡組成 SLI配置時(shí),這些利用 GPU 的游戲最高可實(shí)現(xiàn) 2 倍的大幅性能提升。 大多數(shù)當(dāng)今最火爆的游戲以及新一代游戲均屬這一類型。 然而,一些應(yīng)用程序 (通常是年代較老的應(yīng)用程序) 還是會(huì)受到 GPU 處理能力以外的其它因素限制。
最常見的限制便是 CPU。 如果一款應(yīng)用程序受限于 CPU,那么無論怎樣增強(qiáng)圖形動(dòng)力也不會(huì)提升應(yīng)用程序的性能。 在 1024x768 這樣的低分辨率且不開其它功能的情況下,這種現(xiàn)象最為常見。 啟用抗鋸齒以及各向異性過濾或切換至更高分辨率通??梢詫⑻幚砣蝿?wù)從 CPU 移交給 GPU 處理。
主板芯片組根據(jù)其對(duì)兩塊顯卡實(shí)際提供的PCI Express Lanes,支持SLI的方式也不盡相同,有采用PCI Express X16加PCI Express X4的,也有采用雙PCI Express X8的,nVIDIA自己的nForce Pro 2200+nForce Pro 2050以及nForce4 SLI X16和nForce4 SLI X16 IE則實(shí)現(xiàn)了真正的雙PCI Express X16的SLI。
Hybrid SLI
在最新的MCP78中提供了hybrid SLI功能,即為獨(dú)立顯卡和集成顯卡的SLI。有兩種SLI方式。電源模式和性能模式
電源模式:當(dāng)整合主板和高檔NVIDIA顯卡組成SLI時(shí),在2D模式下使用集成顯卡,在3D模式下使用獨(dú)立顯卡。這樣可以起到省電的效果。
性能模式:當(dāng)整合主板和低檔NVIDIA顯卡如Geforce8400或者Geforce8450組成SLI時(shí),可以是兩張顯卡同時(shí)參與渲染而大幅提升圖形性能。
內(nèi)容來自百科網(wǎng)