亚洲国产精品第一区二区_操操操av_国产欧美日本_成人在线影视_一区二区中文字幕_国产精品二区一区

您當前的位置主頁 > SEO優化 > 瀏覽文章

搜索引擎核心算法:自然語言和布爾搜索

來源:SEO優化 2013-08-07

快速提升網站銷量,使用365webcall網頁客服系統

剛開始時有2000個網頁,但使用布爾邏輯運算符來分解數據集合,就大大減小了搜索范圍

本人從事搜索引擎相關的工作已有十一年,今天與大家一起談談搜索引擎核心算法之:自然語言和布爾搜索論述引出了如下結論:搜索爬蟲和搜索引擎使用某種啟發式方法給網頁排名,并返回結果爬蟲觀察模式,以確定某網頁的內容,搜索引擎在搜索查詢中查找模式,并與爬蟲識別的模式進行比較,并返回結果

這個理論的復雜性在于,我們使用的是活躍的、不斷成長、不斷演變的語言,這意味著語言的使用模式也在不斷變化為了跟上這種變化,搜索引擎也必須是活躍的、不斷成長、不斷演變的,所以在理解如何針對搜索引擎定位阿站時,啟發式方法是一個非常重要的概念理解它的最簡單方法是比較過去和現在的搜索行為,確定搜索是如何演變的

開始時使用布爾搜索

今天,人們的搜索方式與搜索引擎剛剛問世時的搜索方式完全不同記得以前提過 Archie、Gopher、Jughead和verojnuca 這些早期的索引和搜索程序的能力是相當有限的,要在索引中查找信息,必須對索引非常了解實際上,使用Archie和Gopher時,必須知道所要查找的文檔或文件的確切位置

有了Jughead和Veronica后,就可以實際搜索信息了:但那時,搜索仍是非常基本的當搜索最終變為可能時,如何查找文件是有一些嚴苛的規則的在搜索引擎的早期,還沒有今天非常普遍的自然語言搜索

用戶必須指定他們要搜索“這個短語”,而不是搜索“那個短語”,或者精確搜索某個短語.輸入靠爾邏輯——在索引中查找正確的文件或文檔所需的方法布爾邏輯基于GeorgeBoole在19世紀中葉提出的邏輯代數系統

實際上,布爾邏輯就是把數據分解為集合,直到數據集合非常小,滿足初始查詢提出的要求為止例如,在搜索時,網絡上可能有1000個網頁有關“pools”,有1000個網頁有關“saltwater”,如果搜索“saltwater pools”,就會返回所有2000個阿頁這實在太多了但合并這兩個術語,僅查找既包含“saltwater”、又包含“pools”的網頁,則只返同原來2000個阿頁中的一小部分,如圖5—1所示

為了使這個例子更進一步,可以添加一個限制符,例如“not chlorine”,以縮小數據集合添加這個限制符時,會去除另外部分數據,滿足“pools,saltwater. but not chlorine”查詢的選項就更少了,如

這個例子演示了布爾搜索中使用的3個運算符:與、或、非布爾邏輯基于邏輯代數系統,所以這些運算符都可以用一個符號表示:

·與:+

·非;

·或:默認運算符,返回包含任意一個單詞的所有頁面,而不管它們的接近程度如何該運算符用單詞之間的空格表示現在找到需要的內容的可能性更大,且查找速度更快

在互聯網搜索的早期.布爾邏輯幫助用戶定位需要的文件和文檔從啟發式方法的角度來看,布爾邏輯為搜索提供了完美的問題解決能力但技術會逐漸成熟起來……

小站(BET365)

文章編輯: 365webcall網上客服軟件(www.365webcall.com)

我的評論

登錄賬號: 密碼: 快速注冊 | 找回密碼

主站蜘蛛池模板: 啪啪免费网站 | 久久这里有精品 | 日韩理论视频 | 久久成人精品一区二区三区 | 中文字幕在线网址 | 久久久久久久福利 | 在线a视频网站 | 亚洲成人免费 | 日韩欧美一级精品久久 | 国产一级免费在线观看 | 亚洲免费精品网站 | 国产精品美女www爽爽爽动态图 | 久草精品在线 | 一区二区三区国产亚洲网站 | 欧美一区二区三区在线 | 欧洲一级毛片 | 91免费看片神器 | 一级女性全黄久久生活片免费 | 国产精品一区二 | 国产精品㊣新片速递bt | 日韩高清二区 | 手机在线成人免费视频 | av在线一区二区三区 | 久久手机在线视频 | 四虎影城 | 亚洲日本三级 | 成人一区二区三区视频 | www.亚洲一区二区 | 亚洲欧美综合精品久久成人 | 天天干天天操天天爽 | 欧美日韩一区二区在线 | 久久大陆 | 中文字幕视频在线 | 欧美日韩高清在线一区 | 欧美日韩在线一区 | 一区二区三区四区日韩 | 九九九九九九精品 | 羞羞视频在线播放 | www.中文字幕 | 久久精品亚洲 | 精品视频久久 |