【悪用厳禁ChatGPTプラグイン】他社サイトをスクレイピングできる「Scraper」の導入方法から使い方

今回は、Webサイトから情報をスクレイピングできる、ChatGPTプラグイン「Scraper」を紹介します。

スクレイピングとは、Webサイトから情報を自動的に取得する技術のことを指します。
手動で情報を集める手間が省け、大量のデータを効率的に処理することが可能です。

例えば、下記の様なことができます。

  • 特定した商品の価格情報を複数のECサイトから一括で取得
  • ニュースサイトの最新記事を自動的に取得

この技術は、市場調査や競合分析、ニュースのトレンド分析など、ビジネスの様々な場面で活用されています。

「Scraper」プラグインは、プログラミング知識がなくても、スクレイピング作業をChatGPTの簡単なプロンプトで行うことが可能です。

スクレイピングは情報収集の効率化を実現し、ビジネスの競争力を高めるための強力なツールとなります!
あなたも「Scraper」プラグインを使って、情報収集の新たな可能性を探ってみませんか?

以下にその導入方法から使い方までを説明します。

ぜひ最後までご覧くださいっ!

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

目次

ChatGPTプラグイン「Scraper」の導入方法

ChatGPTのプラグインをインストールするためには、有料のChatGPT Plusのユーザーである必要があります。

導入する手順は次の2ステップです。

  • プラグインストアで「Scraper」と検索
  • 「Scraper」プラグインをインストール

さあ、このプラグインでいくつかの有名なサイトをスクレイピングしてみましょう!

サービス紹介資料

【無料】2023年11月版生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIの業務活用コンサルティング

・システム間API連携

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

ChatGPTプラグイン「Scraper」でスクレイピングしてみた

ここでは、ChatGPTプラグイン「Scraper」を使ってYoutube、Wikipedia、自社メディアのWebページの情報をスクレイピングしてみました。

ご覧ください!

YouTubeをスクレイピング

最初のテストでは、YouTubeチャンネルから、動画のタイトル、視聴数、公開日などのデータを抽出します。
今回は、ビジネス映像メディア「PIVOT」のYouTubeチャンネルを利用させて頂きました。



では、さっそく始めていきます。最初に、動画一覧ページの公開タイトル、視聴数、公開日をスクレイピングします。

プロンプト:

以下のWebサイトに掲載されているビデオの公開タイトル、視聴数、公開日を抽出してください。
https://www.youtube.com/@pivot8935/videos

結果:

簡単なプロンプトだけでここまで正確に情報を抽出してくれるのは驚きです!
ですが、最初の5件までしか表示されなかったので、さらに追加してもらうように指示を出してみました。

プロンプト:

以前提供したYouTubeのウェブサイトからさらに5項目をスクレイピングしてください。

結果:

指示通りに追加してくれましたね!

最後に、スクレイピングしてもらった全ての情報を表にまとめます。

プロンプト:

スクレイピングした10項目を表にまとめてもらえますか?

結果:

綺麗にまとめてくれましたね!

スクレイピングしたデータを表にすることで、ExcelやGooglesheetでコピー&ペーストして使うことができます。

Wikipediaをスクレイピング

次に、Wikipediaをスクレイピングしてみます。
情報は Wikipediaの最近の出来事 から、取得してもらおうと思います。


最初に、ヘッドラインの情報をスクレイピングします。

プロンプト:

以下のWebサイトに掲載されているヘッドラインを抽出してください。
https://ja.wikipedia.org/wiki/Portal:%E6%9C%80%E8%BF%91%E3%81%AE%E5%87%BA%E6%9D%A5%E4%BA%8B

結果:


ヘッドラインの情報だけを、問題なく抽出できていますね!

次に、特定の期間だけのデータを抽出します。

プロンプト:

以下のWebサイトに掲載されている2023年7月の情報を抽出してください。
https://ja.wikipedia.org/wiki/Portal:%E6%9C%80%E8%BF%91%E3%81%AE%E5%87%BA%E6%9D%A5%E4%BA%8B

結果:

指示だけでここまで正確にスクレイピングできるのは凄いと思います。

Webページをスクレイピング

最後に自社メディアをスクレイピングしてみます!

まず、記事一覧のタイトルと公開日を取得します。

プロンプト:

以下のWebサイトに掲載されている記事のタイトルおよび公開日を抽出してください。
https://weel.co.jp/column/

結果:

ページに掲載されている、全ての記事を取得できました。

個別ページでも試してみます。
今回は、弊社メディアの「Code Interpreter」の記事から特定の見出しの本文を取得するという操作を行います。

以下の画像は、その「Code Interpreter」の記事の一部を示しています。
この記事の見出しでは、ChatGPT上でPythonプログラムを実行する方法について詳しく説明されています。

プロンプト:

以下のWebサイトに掲載されている見出し「ChatGPT上でのPythonプログラムの実行」の本文を抽出してください。
https://weel.co.jp/2023/07/11/%e3%80%90code-interpreter%e3%80%91%e8%aa%b0%e3%81%a7%e3%82%82ai%e3%82%a8%e3%83%b3%e3%82%b8%e3%83%8b%e3%82%a2%e3%81%ab%e3%81%aa%e3%82%8c%e3%82%8b%ef%bc%81chatgpt%e5%85%ac%e5%bc%8f%e3%83%97%e3%83%a9/

結果:

特定の見出し(ChatGPT上でのPythonプログラムの実行)の本文のみ抽出してくれました。
プログラムコードも、きちんと判別してくれていて見やすいですね!

サービス紹介資料

【無料】2023年11月版生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIの業務活用コンサルティング

・システム間API連携

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

ChatGPTプラグイン「Scraper」はサイトの情報をスクレイピングするのにおすすめ!

今回は、Webサイトから情報をスクレイピングできるChatGPTプラグイン「Scraper」について紹介しました。
ChatGPTプラグインは、有料プランのChatGPT Plusに加入しているユーザーのみ利用できます。

導入する手順は次の2ステップです。

  1. プラグインストアで「Scraper」と検索
  2. 「Scraper」プラグインをインストール

Scraperプラグインは、簡単な指示だけでYouTube、Wikipedia、Webページなど、さまざまな媒体の情報を簡単に抽出することが可能です。
このプラグインを利用することで、データを抽出する手間が大幅に省かれ、作業が効率的になります。

なお、リアルタイムの情報にアクセスできるWebPilotについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
【WebPilot】最新の情報を取得できるChatGPTプラグイン!悪用厳禁な使い方10選

弊社では法人向け生成AI研修・勉強会を行なっています

いかがだったでしょうか?

弊社では、法人様向けに生成AI研修を行なっております。
また、研修に加えて本事業の支援も行わせていただいております。

詳しくはこちらをご覧ください!
セミナー実績 | WEEL

研修をさせていただいた企業様からは、以下のような好評をいただいております。

生成AIについて包括的に理解ができ、多くの業務で生成AIが活用されるようになった。
生成AIの事例を知ることで、社内で生成AIを活用するためのアイデアがたくさん出てくるようになった。
全社で生成AIに関する認識を共有できたので、生成AIに関するプロジェクトの理解が得られるようになった。

研修の内容としては、以下のようなものになっています。

1. 生成AIの概要
2. 生成AIの歴史
3. 生成AIのリスク・対応策
4. 生成AIの活用事例
5. 生成AIの未来予測
6. 〇〇業界特有の生成AI活用法(様々な業界に対応)
7. プロンプトエンジニアリング実践(ChatGPTや画像生成AIへの入力文)
8. AI開発実践(Pythonプログラミング)
9. 生成AIの社内導入手順

※企業様のニーズに合わせて内容はカスタマイズしています。

「社員に生成AIに関する知識を身に付けてもらいたい」
「今後、生成AIを活用して事業展開をしていきたい」

と考えている方は、まずはご相談から承っておりますので、ぜひご連絡ください。

➡︎生成AIセミナー・社内勉強会について相談をしてみる

生成AIをもっと活用していきたい方へ

\ 生成AIツールの活用方法のご提案からツールの開発・実装までサポートします!/

document

弊社では以下のようなお悩みをご相談いただいております。

・生成AIを社内で活用するには?

・おすすめの生成AIツールを知りたい…

・生成AIの業務効率化方法がわからない!

・生成AIの開発を行いたい!

弊社の生成AIに精通したAIコンサルタントが、お悩みをヒアリングし、ベストなソリューションを提案します。

よくわからないけど、とりあえず話を聞きたいという方でも大丈夫です。

お気軽にご相談ください!

投稿者

  • Hiromi Sai

    ChatGPTメディア運営 / テクニカルライター リベラルアーツ専攻。大学休学中は、Webマーケティング会社のマネージャーとしてライター、ディレクター100名のマネジメントをする。南米のチリとタイでの長期居住歴を持つ。

  • URLをコピーしました!
  • URLをコピーしました!
目次