新聞資訊  快訊  焦點  財經  政策  社會
互 聯 網   電商  金融  數據  計算  技巧
生活百科  科技  職場  健康  法律  汽車
手機百科  知識  軟件  修理  測評  微信
軟件技術  應用  系統  圖像  視頻  經驗
硬件技術  知識  技術  測評  選購  維修
網絡技術  硬件  軟件  設置  安全  技術
程序開發  語言  移動  數據  開源  百科
安全防護  資訊  黑客  木馬  病毒  移動
站長技術  搜索  SEO  推廣  媒體  移動
財經百科  股票  知識  理財  財務  金融
教育考試  育兒  小學  高考  考研  留學
您當前的位置:首頁 > 新聞 > 互聯網

微軟開源了 Bing 搜索背后的關鍵算法

時間:2019-05-16 11:39:45  來源:  作者:

微軟剛剛宣布開源一項 Bing 搜索背后的關鍵算法——SPTAG,它使 Bing 能夠快速將搜索結果返回給用戶。

僅在幾年前,網絡搜索很簡單,用戶輸入幾個關鍵詞并瀏覽結果頁面。 今天,相同的用戶可能會在手機上拍照并將其放入搜索框中,或使用智能助手提問,而無需親自觸摸設備。他們也可能會輸入一個問題并期待一個實際的答復,而不是一個可能答案的頁面列表。

SPTAG (Space Partition Tree And Graph)是分布式近似最近鄰域搜索(ANN)庫,為大規模矢量搜索場景提供高質量矢量索引構建、搜索和分布式在線服務工具包。利用 SPTAG 算法作為開源 Python 庫的核心,Bing 能夠在幾毫秒內搜索數十億條信息。

當然,矢量搜索本身并不是一個新想法,微軟所做的是將這一概念應用于深度學習模型。

首先,團隊采用預先訓練的模型并將數據編碼到矢量中,其中每個矢量代表一個字或像素。然后使用新的 SPTAG 庫生成向量索引。隨著查詢的進入,深度學習模型將該文本或圖像轉換為向量,該庫緊接著就能在索引中找到最相關的向量。

微軟表示,SPTAG 庫迄今已對超過 1500 億條數據進行了編目,包括單個單詞、字符、網頁代碼段和完整查詢。

“Bing 每天處理數十億個文檔,現在的想法是將這些條目表示為向量,并搜索這個 1000 億以上向量的巨大索引,以便在 5 毫秒內找到最相關的結果”。

Bing 團隊期望開源 SPTAG 可用于構建可識別基于音頻片段所說語言的應用,或用于讓用戶拍攝植物照片并識別屬和物種的服務。

該庫現已開放使用,并提供構建和搜索這些分布式矢量索引的所有工具。



Tags:微軟 Bing   點擊:()  評論:()
聲明:本站部分內容來自互聯網,內容觀點僅代表作者本人,如有任何版權侵犯請與我們聯系,我們將立即刪除。
▌相關評論
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
▌相關推薦
微軟剛剛宣布開源一項 Bing 搜索背后的關鍵算法——SPTAG,它使 Bing 能夠快速將搜索結果返回給用戶。僅在幾年前,網絡搜索很簡單,用戶輸入幾個關鍵詞并瀏覽結果頁面...【詳細內容】
2019-05-16   微軟 Bing  點擊:(21)  評論:(0)  加入收藏
推薦資訊
相關文章
    無相關信息
欄目更新
欄目熱門
31选7开奖11185