荒野悲歌 作品

第541章 Hadoop



            聽過許亮傑的話,周不器又叫來首席技術官程秉皓,也詳實溝通了一下搜索的事。

新浪的愛問搜索,就是他帶隊做出來的。

如果他去年不離開新浪,說不定憑藉此功勞,就能晉升為新浪的Cto了。

不過,他現在是紫微星的Cto,也一點不差。

程秉皓的看法跟許亮傑差不多,而且更加地本土化。

“百度為什麼做內容?因為在國內做搜索,做內容是唯一能夠生存下去的方式。”

程秉皓的看法更加的銳利直接。

在國內做搜索,跟硅谷不一樣,要根據法律法規,要移除和屏蔽一些內容。以及要貼心的為用戶考慮,通過一些深度算法,幫助用戶移除一些深度的專業化內容。

因為越專業越小眾,越庸俗越大眾。

要想獲取最多的大眾用戶的喜愛,不能提供太專業的內容,而是要提供一些淺白易懂、不那麼複雜的搜索結果。

比如百度那邊已經在做機器學習,也就是最早期的人工智能。即通過用戶搜索結果以及對搜索結果的反饋,來讓機器學習。從而在未來搜索的時候,讓機器幫忙推薦更符合大眾口味的最優解。

這就又產生了一個好處,可以進一步的縮小檢索範圍。

百度的搜索技術比不上谷歌,差距之大……遠遠超出想象。其實也不止百度了,雅虎、微軟也一樣。

谷歌能在最短的時間內,在海量的互聯網數據中搜索出相關內容,然後根據算法排列,呈現在用戶電腦前。

可其他的搜索引擎不行。

要想給用戶提供最快的響應速度,怎麼辦?

最簡單的方法,就是縮小檢索目標。

谷歌檢索10億條信息,百度就檢索1億條信息。

信息來源少了,搜不出想要的答案,也就不奇怪了。

所以,百度要想坐穩國內第一的寶座,就一定、只能、必須做內容。通過自產的內容,來彌補檢索技術方面的弱項。

這種方法,沒法滿足高端用戶的需求,卻可以滿足全社會中80%的用戶需求了,這就夠了。

可以說,百度的李總通過正面退怯、背後遊擊的方式,完成了對谷歌在搜索領域霸權的挑戰,並且成功了。單從這一點來說,可比微軟、雅虎等巨頭強了不少,那夥人還在苦哈哈的想跟谷歌玩技術呢。

玩個屁啊,根本不是一個量級的。

在大數據處理的領域,全球科技公司都要依靠一個叫hadoop的開源核心架構。這個架構來源,就是谷歌對自身算法理論的公開,卻沒有公開算法細節。所以雅虎和阿帕奇就牽頭合作,召集了一大批頂尖科學家,根據谷歌的算法理論,做出了這個大數據處理系統。

可問題很多,距離谷歌公佈的一些、雅虎、百度等巨頭,都要使用這個開源系統。

只有谷歌不用。

不僅不用,他們還在2010年完成了系統的更新……把原來的理論推翻,上線了一個更先進更高端的大數據管理系統。

也就是說,全世界科技巨頭們使用的大數據管理系統的底層架構,比谷歌淘汰的那個舊版本,還要落後幾倍的效率。