搜索引擎收錄是搜索引擎收錄一個網站頁面具體的數(shù)量值,收錄的數(shù)量越多,收錄的時間越快,證明此網站對搜索引擎比較友好。
微軟于12日宣布了一種全新的名為“Catapult”的構件,它可大幅提升微軟旗下搜索引擎必應(Bing)的搜索性能,其內置有一個專門的可重復編程芯片。據稱微軟準備在2015年將這一技術應用到自家所有數(shù)據中心。無獨有偶,中國最大的搜索引擎百度也宣布了相似的消息。百度在加利福尼亞州庫比蒂諾召開的HotChips學術大會上遞交了論文,該大會致力于分享微處理器及其相關技術方面所取得的成果。
如今,圖形芯片被認為是個人電腦和游戲機的重要組成部分,正如幾年前,音頻加速器也被人們認為是必不可少的。這些芯片各司其職、效率極高,共同為我們的電腦服務。還有一類芯片,也就是我們常說的微處理器,如英特爾的酷睿處理器、AMD的A系列APU(加速處理單元)和ARM的Cortex處理器,它們屬于通用芯片,這意味著它們能夠勝任各種復雜任務。
FPGAs(現(xiàn)場可編程門陣列)的定位恰好位于兩者之間,比起專一功能的芯片,它在更低的性能條件下,具有一定的可編程性。微軟的高級研究設計工程師AndrewPutnam說,最初的想法是用FPGAs讓老舊服務器重獲新生,同時“增加服務器的靈活性”。用他的話來說,“一旦數(shù)據中心采購了一臺服務器,這臺服務器往往得工作到壽終正寢。”
靈活性對于軟件算法的提升至關重要,搜索算法就是一個典型的例子,搜索算法本身需要不斷地微調和優(yōu)化。AndrewPutnam說,隨著時間的推移,固定功能的服務器加速器效率會變得越來越低,浪費空間和電力。
AndrewPutnam的團隊曾嘗試使用6臺賽靈思公司(Xilinx)的FPGAs,但最終放棄。因為這會使服務器的設計復雜化、易產生單點故障以及散熱過大,這些問題讓支撐Bing和微軟云服務的數(shù)據中心的管理者頗為不安。于是微軟轉向了“Catapult”,其內置AlteraStratixVG5D5,擁有8GB內存、32MB閃存和PCIGen3x8通路。
Catapult會出現(xiàn)在微軟的開放式服務器中,“開源計算”(OpenComputeProject)這一想法最早由Facebook提出并發(fā)揚光大,該項目旨在為面向運行互聯(lián)網服務的高效節(jié)能計算機提供技術參數(shù)和設計信息,并將其進行共享,從而通過共享設計參數(shù)來促進專業(yè)服務器的有效性和需求。這也就意味著,戴爾、惠普這些硬件供應商將無法再繼續(xù)完全掌控服務器產品的設計流程。微軟的服務器擁有兩個主頻為2.1GHz的8核因特爾至強(Xeon)處理器,一個64GBDRAM(動態(tài)隨機存取存儲器),4個2TB硬盤及兩個512GBSSD。微軟將一塊FPGA芯片插入到每臺服務器中,同時將服務器又插入到半機架(48臺服務器)中。FPGA芯片通過6x8的圓環(huán)形網絡中的電纜相連。
微軟隨后擴大了FPGA芯片的試驗范圍,對數(shù)據中心的1632個服務器進行了試驗。AndrewPutnam說,微軟發(fā)現(xiàn)了FPGA芯片提高了Bing的搜索性能。Bing的搜索處理量提升了一倍,搜索時間縮短了29%,隨之而來的好處是微軟的服務器數(shù)量可以削減一半。
AndrewPutnam說道,這個測試非常成功,將在2105年覆蓋所有的Bing服務器。目前所面臨的挑戰(zhàn)是繼續(xù)挖掘FPGA技術的其它應用場景。
讓我們再來看看中國的搜索巨頭百度。百度在中國有數(shù)萬個服務器,它也采用了FPGAs來提升深度神經網絡(DeepNeuralNetworks)的性能,這種算法涵蓋了傳統(tǒng)搜索、語音識別乃至圖片搜索和識別。百度使用搭載了賽靈思公司(Xilinx)K7480t-2lFPGA芯片的主板,可以在任何類型的IU和2U服務器上實現(xiàn)拔插。在不同的工作負載下,FPGA比CPU和GPU的效率都要高出好幾倍。
從用戶的角度出發(fā),他們關心的是必應(Bing)和百度搜索服務的質量。目前Bing和百度都致力于提升自家搜索算法的效率和性能,這對廣大用戶來說無疑是個好消息。