【スマートモード】【フローチャートモード】Webhookの使い方 | Webクローラ | ScrapeStorm
摘要:本文では、Webhook機能の使い方を紹介します。プライミング必要なし、使いやすいです。 ScrapeStorm無料ダウンロード
ScrapeStormはWebhookをサポートしています。 この機能を使用することにより、ScrapeStormはスクレイピングされたデータをリアルタイムでHTTPアドレスにエクスポートできます。Webhook受信側のコードはユーザー自身で開発する必要があります。
「設定を実行する」でWebhookを設定できます。下記画像のようにご覧ください。

Webhook機能を使用すると、スクレイピングされたデータはJSON形式で送信されます。スクレイピングを終了する時に、スクレイピング終了のイベント通知が送信されます。
Webhook は、HTTP POST の形式でユーザーの HTTP アドレスにデータを送信します。
HTTPヘッダーは "Content-Type: application/json; charset=utf-8"です。
Webhook Token と Timestamp を使用した md5 計算の結果は、JSON データの「sign」署名で検証され、データが正当であるかどうかを検証できます。
データ送信の例:
{
"task_id": 3920415, // タスクのID, 「全てのタスクを表示」でご確認ください。
"task_name": "Scraping task name", // タスク名
"type": "data", // このWebhookは収集されたデータを送信します。
"urls": [ // スクレイピングタスクのエントリ
"http://www.*****.com/list",
"http://www.*****.com/list2"
],
"sign": "**********************", // md5(webhook_token+timestamp)
"timestamp": 1555326657, // 現在のタイムスタンプ
"data_list": [ // データリスト
{
"_id": "0000000000001", // データ ID
"data": {
"title": "風景",
"url": "http://www.*****.com/scenery/"
} // データフィールドの内容
},
{
"_id": "0000000000002", // データ ID
"data": {
"title": "風景2",
"url": "http://www.*****.com/scenery2/"
} // データフィールドの内容
}
]
}
スクレイピング終了通知の送信例:
{
"task_id": 3920415, // タスクのID, 「全てのタスクを表示」でご確認ください。
"task_name": "Scraping task name", // タスク名
"type": "finish", // このWebhookは収集されたデータを送信します。
"urls": [ // スクレイピングタスクのエントリ
"http://www.*****.com/list",
"http://www.*****.com/list2"
],
"sign": "**********************", // md5(webhook_token+timestamp)
"timestamp": 1555326657 // 現在のタイムスタンプ
}