クロール頻度(Crawl Rate) | Webクローラ | ScrapeStorm
摘要:クロール頻度とは、Web クローラーまたはクローラー プログラムがターゲット Web サイトからデータを取得する時間間隔または頻度を指します。 クローラーが更新情報を取得するために Web ページまたは Web サイトを再訪問する頻度を示し、通常は秒、分、または時間単位で測定されます。 ScrapeStorm無料ダウンロード
ScrapeStormとは、強い機能を持つ、プログラミングが必要なく、使いやすい人工知能Webスクレイピングツールです。
概要
クロール頻度とは、Web クローラーまたはクローラー プログラムがターゲット Web サイトからデータを取得する時間間隔または頻度を指します。 クローラーが更新情報を取得するために Web ページまたは Web サイトを再訪問する頻度を示し、通常は秒、分、または時間単位で測定されます。

適用シーン
Web サイトやデータの種類が異なると、データの鮮度とターゲット Web サイトへのアクセス頻度のバランスをとるために、異なるクロール頻度が必要になる場合があります。
メリット:クロール頻度を適切に設定すると、データの適時性が保証され、ターゲット Web サイトの最新情報をタイムリーに取得できるため、リアルタイム性の要件が高いアプリケーションにとって非常に有益です。 同時に、適度なクロール頻度により、ターゲット Web サイト サーバーの負荷が軽減され、その影響が軽減されます。
デメリット:クロールが頻繁すぎると、サーバーに過剰な負荷がかかる可能性があり、準拠していないクロール動作により、対象の Web サイトでクロール対策が引き起こされる可能性があります。
図例
1. Googleクロール頻度。

2. ScrapeStormでクローラーを行う。

関連記事
参考リンク
https://rank-quest.jp/column/column/crawl-rate/