荒野悲歌作品

第541章 Hadoop

 

聽過許亮傑的話，周不器又叫來首席技術官程秉皓，也詳實溝通了一下搜索的事。

新浪的愛問搜索，就是他帶隊做出來的。

如果他去年不離開新浪，說不定憑藉此功勞，就能晉升為新浪的Cto了。

不過，他現在是紫微星的Cto，也一點不差。

程秉皓的看法跟許亮傑差不多，而且更加地本土化。

“百度為什麼做內容？因為在國內做搜索，做內容是唯一能夠生存下去的方式。”

程秉皓的看法更加的銳利直接。

在國內做搜索，跟硅谷不一樣，要根據法律法規，要移除和屏蔽一些內容。以及要貼心的為用戶考慮，通過一些深度算法，幫助用戶移除一些深度的專業化內容。

因為越專業越小眾，越庸俗越大眾。

要想獲取最多的大眾用戶的喜愛，不能提供太專業的內容，而是要提供一些淺白易懂、不那麼複雜的搜索結果。

比如百度那邊已經在做機器學習，也就是最早期的人工智能。即通過用戶搜索結果以及對搜索結果的反饋，來讓機器學習。從而在未來搜索的時候，讓機器幫忙推薦更符合大眾口味的最優解。

這就又產生了一個好處，可以進一步的縮小檢索範圍。

百度的搜索技術比不上谷歌，差距之大……遠遠超出想象。其實也不止百度了，雅虎、微軟也一樣。

谷歌能在最短的時間內，在海量的互聯網數據中搜索出相關內容，然後根據算法排列，呈現在用戶電腦前。

可其他的搜索引擎不行。

要想給用戶提供最快的響應速度，怎麼辦？

最簡單的方法，就是縮小檢索目標。

谷歌檢索10億條信息，百度就檢索1億條信息。

信息來源少了，搜不出想要的答案，也就不奇怪了。

所以，百度要想坐穩國內第一的寶座，就一定、只能、必須做內容。通過自產的內容，來彌補檢索技術方面的弱項。

這種方法，沒法滿足高端用戶的需求，卻可以滿足全社會中80%的用戶需求了，這就夠了。

可以說，百度的李總通過正面退怯、背後遊擊的方式，完成了對谷歌在搜索領域霸權的挑戰，並且成功了。單從這一點來說，可比微軟、雅虎等巨頭強了不少，那夥人還在苦哈哈的想跟谷歌玩技術呢。

玩個屁啊，根本不是一個量級的。

在大數據處理的領域，全球科技公司都要依靠一個叫hadoop的開源核心架構。這個架構來源，就是谷歌對自身算法理論的公開，卻沒有公開算法細節。所以雅虎和阿帕奇就牽頭合作，召集了一大批頂尖科學家，根據谷歌的算法理論，做出了這個大數據處理系統。

可問題很多，距離谷歌公佈的一些、雅虎、百度等巨頭，都要使用這個開源系統。

只有谷歌不用。

不僅不用，他們還在2010年完成了系統的更新……把原來的理論推翻，上線了一個更先進更高端的大數據管理系統。

也就是說，全世界科技巨頭們使用的大數據管理系統的底層架構，比谷歌淘汰的那個舊版本，還要落後幾倍的效率。