ダウンロードと新規登録
無料で$5のクーポンをゲット
入門ガイド 特徴紹介

【スマートモード】【フローチャートモード】ファイルをダウンロードする方法 | Webクローラ | ScrapeStorm

2023-06-27 13:48:05
3988 ビュー

摘要:本文では、ScrapeStormで抽出されたファイルをダウンロードする方法を紹介します。プライミング必要なし、使いやすいです。 ScrapeStorm無料ダウンロード

一、機能の簡単紹介

ScrapeStorm は、データをスクレイピングしながらWebページからファイルをダウンロードすることをサポートしています。サポートされているファイル形式には、画像、音声、ビデオ、ドキュメント、その他の形式が含まれます。下記画像のように起動ボタンをクリックして、タスクの設定画面にファイルのダウンロードができます。

注意:ここはただファイルのダウンロード機能の設定を紹介するだけで、ファイルをダウンロードするについて、フィールドに対応するダウンロードリンクまたはダウンロードボタンを設定する必要があります。

下記画像のようにファイルの保存パスを変更できます。

また、新たなフォルダを新規作成できます。ファイルのタイプ、スクレイピングの日付、タスク名とフィールド名に従って新規フォルダの名前を変更できます。

ソフトウェアはダウンロードされたファイルのファイル名を変更できます。下記画像のように、ダウンロードされたファイル名の変更は、元のファイル名、ファイルのMD5値、タスク名_番号、スクレイピング日付_番号、番号、フィールド名に従って、或はカスタマイズできます。

二、ファイルのダウンロードを設定する方法

ファイルのダウンロードには三つの方法があります。

直接ダウンロードリンクをクリックする。

ダウンロードボタンをクリックする。

データ編集でダウンロードリンクを生成する。

各ファイルのダウンロードの設定は同じ、必要に応じて、選択肢をチェックしてください。これから画像のダウンロードを例として、この三つの方法を紹介します。

1. 直接ダウンロードリンクをクリックする。

画像には、jpg、png、gif、jpeg、bmp、eps、psdなどのフォーマットが提供します。下記のようにオプションをチェックしてください。

(1)リストページの画像のダウンロード

①「フィールドを追加」ボタンをクリックして、ページ内の画像を選択してください。

②生成したフィールドを右クリックして、画像/ビデオ/オーディオのURLを選択してください。

下記GIFのようにご参照ください。

もしダウンロードされた画像が完全ではないか、或は画像はすごく小さくなるか、ダウンロードされた画像が全く開けないか、これは画像のローディングが不完全になり、アンチブロックに遅延時間を設定してください。

(2)詳細ページの画像のダウンロード

もしクリックだけで、全ての目標要素を選択できるなら、下記のように設定してください。

①「フィールドの追加」をクリック、目標要素を選択してください。選択されたのは全ての画像を含めるのがご確認ください。

②フィールドを右クリックして、「外部HTML」を選択してください。

もしクリックで目標要素を選択できないなら、下記のように設定してください。

①最も画像が多いの詳細ページを選択、一つずつ画像をフィールド追加してください。

②フィールドを右クリックして、「画像などのリンク」を選択してください。

もし以上の方法でまた抽出できないなら、下記の手順をご参照ください。

①フィールドの追加をクリックして、右クリック「Xpathの編集」を選択、Xpathで全ての画像を選択してください。

②フィールドを右クリックして、「外部HTML」を選択してください。

補充:スクロールローディングが必要の場合、下記のように設定してください。

スマートモード:事前操作機能を利用して、スクロールコンポを生成します。

フローチャートモード:データ抽出コンポの前にスクロールコンポを追加します。

2. ダウンロードボタンをクリックする。

方法二について、すべてのダウンロードの設定は同じです。

①フィールドの追加をクリック、ページ内のダウンロードボタンを選択してください。

②フィールドを右クリックして、「抽出タイプ」の「ダウンロードボタン」を選択してください。

タスクを起動する時に、必要なファイルのダウンロードをチェックしてください。

3. データ編集でダウンロードリンクを生成する。

方法三の手順は大分方法一に同じ、違うのは抽出されたフィールドの修正です。抽出されたフィールドを右クリックして、データ修正を選択してください。出できたプロンプトでの設定は下記のようにご覧ください。

画像の一括ダウンロード バッチで URL を生成する ウェブページをwordにダウンロードする Pythonダウンロードファイル pythonスクレイピング 動画の一括ダウンロード レギュラーマッチメール Pythonデータスクレイピング phpスクレイピング ウェブコンテンツのキーワードを抽出
关闭