ダウンロードと新規登録
無料で$5のクーポンをゲット
日本語
入門ガイド 特徴紹介 スクレイピング事例

NHKニュースの本文をスクレイピングする

2019-10-23 16:09:31
191 views

摘要:本文では、ScrapeStormのスマートモードを通じでNHKニュースからニュース本文をスクレイピングすることを紹介します。コードを書かなく、使いやすいです。 ScrapeStorm無料ダウンロード

NHKのニュースサイト「NHK NEWS WEB」。国内外の取材網を生かし、さまざまな分野のニュースをいち早く、正確にお伝えします。ニュース速報はもちろん、現場の記者が執筆した読み応えのある特集記事や、NHKならではの豊富な動画コンテンツも。

スクレイピングツールの概要

ScrapeStormは、AIを使用した視覚的なWebスクレイピングツールです。プログラミングが必要なく、ほぼすべてのWebサイトからデータを抽出できます。強い機能を持って、使いやすいです。 URLを入力だけで、自動的に抽出するデータと次のページボタンを識別できます。複雑なルール設定が必要ないし、ただクリックしてスクレイピンができます。

ScrapeStormにより、大量のWebデータを素早く正確的に取得できます。手動でデータ抽出が直面するさまざまな問題を完全に解決し、情報取得のコストを削減し、作業効率を向上させます。

抽出されたデータは下記のようにご覧ください。

1.タスクを新規作成する

(1)NHKニュースのURLをコピーする

リストページのURLをコピーしてください。

ここをクリックして、URLを入力する方法の詳細をご参照ください。

(2)スマートモードタスクを新規作成する

直接新しいタスクを作成しますか、持っているタスクをインポートすることもできます。

ここをクリックして、タスクのインポート方法をご参照ください。

2.タスクを構成する

(1)フィールドの設定

必要に応じてフィールドを追加または削除し、フィールドの名前を変更します。 フィールド設定の結果は次のとおりです。

ここをクリックして、フィールドの設定の詳細をご参照ください。

(2)ページボタンの識別

NHKニュースには、ただ20件のニュースを展示します。ソフトウェアは自動的にスクロールローリングに識別しますが、この場合直接タスクを起動すると、次のページのニュースが抽出できません。より多くのニュースを表示させるため、手動でページボタンを選択する必要があります。選択方法は下記のように、選択ページボタンをクリックして、ページ内の「もっと見る」を選択します。

ここをクリックして、ページ分けの設定方法をご参照ください。

(3)詳細ページのスクレイピング

各ニュースの本文には詳細ページをスクレイピング必要があります。「詳細ページに行く」ボタンをクリックして、ニュースの本文がスクレイピングできます。

3.タスクの設定と起動

(1)起動の設定

必要に応じて、スケジュール、アンチブロック、自動エクスポート、画像のダウンロード、スピードブーストを設定できます。

スクレイピングタスクを設定する方法については、ここをクリックしてください。

(2)しばらくすると、データがスクレイピングされる

4.抽出されたデータのエクスポートと表示

(1)エクスポートをクリックして、データをダウンロードする

(2)必要に応じてエクスポートする形式を選択する

ScrapeStormは、Excel、csv、html、txt、データベース、ローカルなどさまざまなエクスポート方法を提供します。ライトプラン以上のユーザーは、WordPressに直接投稿することもできます。

ここをクリックして、抽出結果を表示し、抽出されたデータを消去する方法の詳細をご覧ください。

ここをクリックして、抽出結果のエクスポート方法の詳細をご覧ください。

免責事項: 本文はユーザーが提供して、侵害がありましたら、ご連絡してすぐに削除します。ScrapeStormは、ユーザーが本ソフトウェアを使って行うすべての行為に対して、一切責任を負いません。