fbpx

Elasticsearch 的幕後推手 – Elastic web crawler

最智慧直觀的索引

內容索引和同步是任何優質搜尋網站背後的重要功能。Elastic web crawler 賦予您強大的搜尋力和靈活性,讓您在提取內容時省去許多麻煩。

網路爬蟲是什麼?


網路爬蟲是一種快速索引網站所有內容的方式。您只需告訴它要掃描網站上哪些部分 ─ 或以網路術語來說是「抓取」(crawl)  ─ 它就會完成所有索引網站內容的繁重工作。然後在您指定的時間內,自動重新抓取並保持內容同步。這就像魔術一樣,您的內容已準備就緒,可供搜尋。 

elastic web crawler image

有了 Elastic web crawler,您便能 …

難忘的搜尋體驗

Elastic 還有很多打造一流搜尋體驗的工具,如:Search APIs反向檢索 (inverted index) 等。Elastic web crawler 只是眾多 Elastic 工具中的一個,這些工具讓您更快創造價值、建立、維護和優化強大又靈活的網站搜尋功能。

不需為了爬蟲勞費心力

由於網路爬蟲會自動處理複雜的索引,您便能專注於更重要的事:提高網站的參與度、打造吸睛的內容,並有策略地優化搜尋體驗。

  • 一勞永逸 (Fire and forget):儘管為原始的索引技術,該網路爬蟲非常容易使用 ─ 無需編寫程式。您可在直觀的用戶介面上完全控制爬蟲。
  • 編寫程式:若您想深入瞭解背後的運作,您可以用靈活的 API 完全控制網路爬蟲。
  • 規則由您制定:輕鬆配置規則,並自訂抓取方式,包括允許或阻止對網站的某些部分進行索引。
  • 完全掌控爬蟲活動:詳細的活動日誌和指標讓您充分瞭解爬蟲的狀況與紀錄,因此您了解索引的狀況。此外,Kibana 也將給您無數的視覺化工具。

相關文章