搜索引擎接收到用戶輸入的搜索詞后,需要對(duì)搜索詞做一些處理,才能進(jìn)入排名過程。
搜索詞處理包括以下幾方面:
(1)中文分詞。與頁面索引時(shí)一樣,搜索詞也必須進(jìn)行中文分詞,將查詢字符串轉(zhuǎn)換為以詞為基礎(chǔ)的關(guān)鍵詞組合。分詞原理與頁面分詞相同。
(2)指令的處置。平時(shí)咱們?cè)谒阉鲿r(shí)會(huì)輸入多個(gè)詞語,實(shí)在默認(rèn)的情況下,搜索引擎把多個(gè)默認(rèn)的詞語都依照“與”來進(jìn)行詞語。比方你搜索“seo”“培訓(xùn)”時(shí),搜索引擎會(huì)默認(rèn)咱們輸入的“seo培訓(xùn)”來進(jìn)行處置,獨(dú)自包括“seo”或者“培訓(xùn)”的網(wǎng)站內(nèi)容實(shí)踐上將不會(huì)返回,但實(shí)際情況往往也會(huì)呈現(xiàn)獨(dú)自包括一個(gè)詞語的網(wǎng)站。另外,還要處置各種高等搜索指令的詞語,比方加號(hào)減號(hào)等。
(3)停止詞。和索引時(shí)一樣,搜索引擎也需要把搜索詞中的停止詞去掉,最大限度地提高排名相關(guān)性及效率。
(4)過錯(cuò)糾正。用戶如果輸入了明顯錯(cuò)誤的字或英文單詞拼錯(cuò),搜索引擎會(huì)提示用戶正確的用字或拼法。
(5)整合搜索觸發(fā)。某些搜索詞會(huì)觸發(fā)整合搜索,比如明星姓名就經(jīng)常觸發(fā)圖片和視頻內(nèi)容,當(dāng)前的熱門話題又容易觸發(fā)資訊內(nèi)容。