搜尋服務的運作方式

搜尋引擎的功能是什麼?

搜尋引擎是圖書館的數位化版。藉由使用全面的索引找出查詢的正確資訊。瞭解搜尋的基本概念後,您就能協助使用者「搜尋」您的內容。

檢索器如何瀏覽網路

檢索就像閱讀圖書館中所有書籍一樣。搜尋引擎必須先盡可能從網路取得大量資訊,才能提供搜尋結果。為此,搜尋引擎會使用檢索器,也就是能夠從網站前往網站的程式,其運作方式就像瀏覽器。

如果書籍或文件遺失或受損,檢索器將無法閱讀。檢索器會嘗試擷取每個網址來判斷文件狀態。如果文件傳回錯誤狀態碼,檢索器就無法使用其中的任何內容,也可能稍後重試網址。這可確保只有可公開存取的文件進入索引。

如果檢索器發現重新導向狀態碼 (例如 301 或 302),便會追蹤重新導向到新網址,並在該處繼續。收到成功的回應後,代表使用者找到了可存取的文件,接著檢查是否允許檢索,然後再下載內容。

這項檢查包含 HTML 和 HTML 中提及的所有內容,例如圖片、影片或 JavaScript。檢索器也會從 HTML 文件中擷取連結,讓檢索器也能造訪連結的網址。檢索器會透過追蹤連結,在網路上尋找新網頁。

檢索器不會主動點選連結或按鈕,而是將網址傳送到佇列以便之後檢索。存取新網址時,無法使用 Cookie、服務工作站或本機儲存空間 (例如 IndexedDB)。

建構索引

擷取文件後,檢索器會將內容交給搜尋引擎,以便將其新增至索引。搜尋引擎現在會算繪並分析內容,以便瞭解內容。轉譯是指以瀏覽器形式顯示網頁 (有部分限制)。

搜尋引擎會查看關鍵字、標題、連結、標題、文字等資訊。這些稱為「信號」,用於描述網頁內容和背景資訊。信號能讓搜尋引擎以最有效率的網頁回答任何特定查詢。

搜尋引擎可能會在不同的網址中找到相同的內容。舉例來說,「蘋果派」的食譜可能就位於 /recipes/apple-pie 下方和 /recipes/1234 底下。為避免將食譜編入索引並重複顯示食譜,搜尋引擎會判斷主要網址應使用什麼,並捨棄顯示相同內容的替代網址。

提供最實用的結果

搜尋引擎不單只是比對查詢與索引中的關鍵字,為了提供實用的結果,他們可能會考慮上下文、替代用語、使用者位置等。舉例來說,「矽谷」可能是指地理區域或電視節目。不過,如果查詢內容是「Silicon Valley cast」,則此地區的搜尋結果並沒有太大幫助。

有些查詢也可以間接進行 (例如「脈動小說曲的歌曲」),搜尋引擎必須解讀這項查詢,並顯示片中音樂的搜尋結果。當使用者搜尋內容時,搜尋引擎會判斷最實用的結果,並向使用者顯示。頁面會根據查詢進行排名或排序。如果找到更多資訊,順序往往會隨時間改變。

後續步驟:如何針對搜尋引擎進行最佳化

現在,您已瞭解搜尋引擎的基本運作原理,您可能會看到針對搜尋引擎進行最佳化的重要性。也就是所謂的 SEO 作業 或稱「搜尋引擎最佳化」確保搜尋引擎能尋找並自動瞭解您的內容,就能讓相關搜尋在帶出您的網站時,獲得更高的曝光率。進而吸引更多感興趣的使用者造訪您的網站。 使用 Lighthouse 稽核網站,並查看 SEO 結果,瞭解搜尋引擎如何讓使用者註意到您的內容。