ダウンロードと新規登録
無料で$5のクーポンをゲット
日本語
入門ガイド 特徴紹介 スクレイピング事例

【スマートモード】【フローチャートモード】ファイルをダウンロードする方法

2019-11-26 16:23:41
767 views

摘要:本文では、ScrapeStormで抽出されたファイルをダウンロードする方法を紹介します。プライミング必要なし、使いやすいです。 ScrapeStorm無料ダウンロード

ScrapeStorm は、データをスクレイピングしながらWebページからファイルをダウンロードすることをサポートしています。サポートされているファイル形式には、画像、音声、ビデオ、ドキュメント、その他の形式が含まれます。下記画像のように起動ボタンをクリックして、タスクの設定画面にファイルのダウンロードができます。

注意:本文紹介したのはただファイルのダウンロード機能の設定かだけで、ファイルのダウンロードリンクが抽出されないなら、ファイルをダウンロードできません。

下記画像のようにファイルの保存パスを変更できます。

また、新たなフォルダを新規作成できます。ファイルのタイプ、スクレイピングの日付、タスク名とフィールド名に従って新規フォルダの名前を変更できます。

ソフトウェアはダウンロードされたファイルのファイル名を変更できます。下記画像のように、ダウンロードされたファイル名の変更は、元のファイル名、ファイルのMD5値、タスク名_番号、スクレイピング日付_番号、番号、フィールド名に従って、或はカスタマイズできます。

ファイルのダウンロードには三つの方法があります。

1.直接ダウンロードリンクをクリックする。

2.ダウンロードボタンをクリックする。

3.データ編集でダウンロードリンクを生成する。

各ファイルのダウンロードの設定は同じ、必要に応じて、選択肢をチェックしてください。これから画像のダウンロードを例として、この三つの方法を紹介します。

一、直接ダウンロードリンクをクリックする。

画像には、jpg、png、gif、jpeg、bmp、eps、psdなどのフォーマットが提供します。下記のようにオプションをチェックしてください。

(1)リストページの画像のダウンロード

①「フィールドを追加」ボタンをクリックして、ページ内の画像を選択してください。

②生成したフィールドを右クリックして、画像/ビデオ/オーディオのURLを選択してください。

下記GIFのようにご参照ください。

もしダウンロードされた画像が完全ではないか、或は画像はすごく小さくなるか、ダウンロードされた画像が全く開けないか、これは画像のローディングが不完全になり、アンチブロックに遅延時間を設定してください。

(2)詳細ページの画像のダウンロード

もしクリックだけで、全ての目標要素を選択できるなら、下記のように設定してください。

①「フィールドの追加」をクリック、目標要素を選択してください。選択されたのは全ての画像を含めるのがご確認ください。

②フィールドを右クリックして、「外部HTML」を選択してください。

もしクリックで目標要素を選択できないなら、下記のように設定してください。

①最も画像が多いの詳細ページを選択、一つずつ画像をフィールド追加してください。

②フィールドを右クリックして、「画像などのリンク」を選択してください。

もし以上の方法でまた抽出できないなら、下記の手順をご参照ください。

①フィールドの追加をクリックして、右クリック「Xpathの編集」を選択、Xpathで全ての画像を選択してください。

②フィールドを右クリックして、「外部HTML」を選択してください。

補充:スクロールローディングが必要の場合、下記のように設定してください。

スマートモード:事前操作機能を利用して、スクロールコンポを生成します。

フローチャートモード:データ抽出コンポの前にスクロールコンポを追加します。

二、ダウンロードボタンをクリックする。

方法二について、すべてのダウンロードの設定は同じです。

①フィールドの追加をクリック、ページ内のダウンロードボタンを選択してください。

②フィールドを右クリックして、ダウンロードボタンを選択してください。

タスクを起動する時に、必要なファイルのダウンロードをチェックしてください。

三、データ編集でダウンロードリンクを生成する。

方法三の手順は大分方法一に同じ、違うのは抽出されたフィールドの修正です。抽出されたフィールドを右クリックして、データ修正を選択してください。出できたプロンプトでの設定は下記のようにご覧ください。