生成AIやChatGPTを使って自動でデータ分析をする方法!おすすめツール5選も紹介
メディア事業部AIライターの中井です。
みなさんは、生成AIでデータ分析ができることを知っていますか?
現在、日本ではデータサイエンティストの不足が問題視されています。実際に、約72%の企業が「データサイエンティストが不足している」と回答しています。
しかし、生成AIを使用することでその問題は解決できるのです。
この記事では、生成AIの概要やデータ分析に活用するメリットとデメリット、おすすめツールを紹介します。最後まで読んでいただくことで、データ分析で生成AIを使用する際の注意点が理解でき、AIを安全に活用する方法がわかります。
ぜひ、最後までご覧ください。
生成AIとは?
生成AIとは、テキストや画像、動画、音声などの新しいコンテンツを生成できる人工知能のことです。
しかし、生成AIと従来のAIの違いや仕組みについて知らない方も多いのではないでしょうか?ぜひ、以下を参考にしてください。
生成AIと従来のAIの違い
生成AIと従来のAIの違いは、新しいコンテンツを自ら生み出す能力があるかどうかです。
具体的には、従来のAIは既存のデータから回答を見つけ出すのに対し、生成AIは学習データを基にして新しいアイデアやコンテンツを創造します。この0から1を生み出す能力により、創造的な作業も自動化が可能になり、ビジネスシーンでの活用が進んでいるのです。
生成AIは、人間に新しい知識やアイデアを提供する、革新的なAI技術です。
生成AIの仕組み
生成AIは、与えられたプロンプト(指示や質問)を解析し、学習済みのデータから特徴を抽出して新しいコンテンツを生み出すように設計されています。
この方法には、ディープラーニングという技術が使われ、AIは既に学んだデータを基に適切な回答を見つけ出します。この方法により、新しいテキストや画像、動画などを生成することが可能です。
つまり、生成AIは既存の情報から新しいアイデアや作品を生み出す能力を持っています。
生成AIの種類
生成AIには、主に画像やテキスト、動画、音声を生成する4つの種類があります。
画像生成AIはテキストから画像を作り、テキスト生成AIは質問に答える形で文章を作成します。動画生成AIは指示にしたがって動画を制作し、音声生成AIは音声データから新しい音声を作り出すことが可能です。
これらのAIは、仕事の効率化や新しいアイデアを考えるのに役立ち、それぞれの目的に合わせて使い分けることができます。
なお、生成AIで自動化する方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→生成AIで自動化する方法!最新の企業成功事例をAIエンジニアが解説
生成AIをデータ分析に使うメリット
ここでは、生成AIをデータ分析に使う5つのメリットについて紹介します。
生成AIを使うことで、データ分析の作業時間を大幅に短縮し、それに伴い人件費も削減できます。ほかにも、数値化できないデータ分析や新しいアイデアの提案も可能です。
以下のメリットを参考にし、データ分析に生成AIを導入してみてください!
数値化できないデータも分析できる
生成AIをデータ分析に使用すると、数値化が難しいデータも分析できる点です。
例えば、顧客の感情やネガポジ(ネガティブ・ポジティブな感情)は、従来の定量分析(数字を使った分析)では捉えにくい要素です。しかし、生成AIを活用することで、これらの感情やネガポジを分析し顧客行動やお客様の分析に役立てることができます。
生成AIを活用することで、新たなビジネスチャンスや顧客理解の深化に繋がる可能性を秘めています。
分析から意思決定まで迅速に行える
生成AIをデータ分析に使うと、迅速な意思決定が可能になります。
生成AIは、膨大なデータを高速で分析し新しいパターンや傾向を発見します。そのため、ビジネス上の意思決定を迅速に行うことができ、効率的な業務運営が可能です。
さらに、生成AIは定型業務も効率化・自動化することが可能で、人件費の削減や労働力不足の解消にも繋がります。
各種コストが削減できる
生成AIをデータ分析に活用することで、時間とお金の面でのコスト削減が可能です。
従来のデータ分析方法に比べ、生成AIは高速で効率的に大量のデータを処理できます。これは、手作業で大量の書類を整理する代わりに、自動で書類を分類・整理するシステムを使うようなものです。
そのため、人件費や作業時間の短縮が実現し、経済的な利点があります。
未発見のパターンが見つけられる
生成AIをデータ分析に使用することで、従来の手法では見過ごされがちな未発見のパターンや法則性を発見できます。
生成AIは、膨大なデータセットから新しい傾向や関連性を抽出する能力を持っています。そのため、人間が解析するのが難しい複雑なデータも効率的に分析でき、ビジネスにおいて新たな洞察を得ることが可能です。
膨大なアイデアが生み出せる
生成AIをデータ分析に使うと、新しいアイデアや解決策が見つかります。
例えば、小売業界で顧客の購買データを分析し、新商品の提案や販売戦略を導き出すことができます。また、医療分野では患者データから治療法のヒントを得ることも可能です。
生成AIは新しい傾向を発見し、これをもとにクリエイティブな案や問題に対する仮説を生成できます。
生成AIをデータ分析に使うデメリット
生成AIをデータ分析に使う際には、デメリットがあるため注意が必要です。
生成AIは、誤った情報を出力したり、基本的な計算をミスしたりすることがあります。そのため、生成AIの出力には慎重に対応し、デメリットを理解しておくことが重要です。
ぜひ、参考にしてください。
出力にばらつきがある
生成AIをデータ分析に使うデメリットとして、出力にばらつきがあることが挙げられます。
AIは複雑なデータや新しいパターンに対して予測が不安定になりがちで、これが分析の正確性を損なう可能性があります。そのため、AIによる分析結果は常に慎重に検証する必要があり、場合によっては人間の判断を組み合わせることが重要です。
このような方法により、生成AIの利点を活かしつつ、リスクを最小限に抑えることができます。
ハルシネーションが混じる
生成AIをデータ分析に使用する際のデメリットは、ハルシネーション、すなわち誤った情報や不正確なデータが生成されるリスクです。
AIは、不完全または偏ったデータを基に分析を行うと、現実と異なる結果を生み出す可能性があります。そのため、AIによる分析結果は常に慎重に検証し、実際の現状と照らし合わせることが重要です。
このようなリスクを理解し、適切に管理することで、生成AIをデータ分析に効果的に活用することが可能になります。
数の処理が苦手
生成AIをデータ分析に使用する際のデメリットは、数値処理における精度の低さです。
生成AIは、基本的な計算でさえ間違えることがあり、これはデータ分析の正確性に影響を与える可能性があります。そのため、AIによる計算結果は常に慎重に検証し、特にビジネス上の重要な意思決定にはAIの出力だけに頼らず、人間のチェックを組み合わせることが重要です。
生成AIは多くの分野で有用ですが数値処理の精度には限界があるため、その点を理解し適切に活用することが重要です。
なお、生成AIの企業利用・開発のリスクとその対策について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→生成AIの企業利用・開発のリスクとその対策を解説!開発失敗事例も紹介
データ分析に使える生成AIツール5選!
データ分析に使える生成AIツールおすすめ5選を紹介します。これから紹介する生成AIツールを使うことで、効率的にデータ分析ができ作業時間が短縮できます。
ぜひ、参考に導入を検討してみてください。
ChatGPT
ChatGPTのAdvanced Data Analysis(旧Code Interpreter)は、データをアップロードして分析するのに便利なツールです。
Advanced Data Analysisを使えば、データの読み込みや分析、クリーニング、視覚化などが簡単にできます。このツールは、Pythonを使って分析を行い、他の言語のコードも理解可能です。つまり、データ分析の全工程をAIがサポートし、手間を省くことができるのです。
Advanced Data Analysisを活用することで、データ分析の時間と労力を大幅に削減でき、より効率的な作業を進めることができます。
Copilot in Excel
「Copilot in Excel」は、データを簡単に分析、理解、視覚化するための生成AIツールです。
このツールは、Excel内でデータを深く掘り下げ、理解を深めるのに役立ちます。Copilotを使うことで、データの強調表示やフィルタリング、並べ替えを簡単にでき、複雑な計算の数式列の提案も受けられます。
したがって、重要な仕事に集中し、効率的にデータ分析を行うことが可能です。
Copilot in Excelは、データ分析における時間と労力を節約し、より高度な分析を実現するための強力なツールです。
DuetAI
DuetAIは、BigQueryでのデータ分析を簡単にできる生成AIツールです。
このツールは、BigQueryでのデータ分析をサポートし、SQLクエリの理解や記述を容易にします。DuetAIの特徴は、自然言語を使用したユーザーの質問や指示に基づいてSQLクエリを生成する能力があります。
そのため、データ分析のためのSQLクエリを簡単に作成し、予測モデルの構築や結果の表示を行うことが可能です。
DuetAIは、データ分析の専門知識がないユーザーでも、BigQueryでのデータ分析タスクを効率的に行うことが可能になります。
QuickSight Generative BI
QuickSight Generative BIは、自然言語でのダッシュボードの作成やデータ分析が可能な生成AIツールです。
このツールは、自然言語での質問に基づいてインタラクティブなダッシュボードを作成し、機械学習を利用してデータのパターンや外れ値を自動的に探します。
QuickSightは、毎週週百万のダッシュボードビューを提供し、エンドユーザーがより適切なデータ駆動型の意思決定を行えるようにします。このツールの主な特徴は、会話形式の質問に対して関連する視覚化を提供し、高度な分析を実行する能力です。
QuickSight Generative BIは、データ分析を行う際に迅速かつ効率的な洞察を提供し、ビジネスの意思決定を支援するツールです。
Rows
Rowsは、AIを使って自動的にデータ分析を行うことができる最新の表計算ソフトウェアです。
このツールは、スプレッドシートの使い勝手を活かしながら、データを直感的に扱えるように設計されています。
Rowsを使用すると、社会メディアやデータウェアハウ、広告プラットフォームなどからのデータを簡単にインポートでき、コードを書く必要がありません。
さらに、GPT-3を活用してデータリストの作成や質問への回答、顧客フィードバックの分類が可能です。チームでの共同作業やインタラクティブなウェブサイトとしてスプレッドシートを共有することもできます。
Rowsは、表計算ソフトの便利さを活かしながら、さまざまなツールと連携してデータをAIで分析できます。
参考:Rows
ChatGPTとExcelを使ったデータ分析のやり方をプロンプト交えて解説
この章では実際にデータ分析のやり方を解説していきます。データ解析ツールとしては、先に紹介したChatGPTを使います。ぜひ、参考にしてみてください。
Excelデータを読み込む
まずはデータ分析を行うためのデータをChatGPTに入力します。
主なやり方は以下の2つです。
- ファイルをアップロードする(ChatGPT有料会員のみ)
- データをChatGPTに直接貼り付ける
ファイルをChatGPTにアップロードするためには、ChatGPTの入力欄左側のクリップマークをクリックして行います。この操作はChatGPTの有料会員でないとできません。
無料会員の方は、Excelデータを直接ChatGPTに貼り付けることで、データ入力が完了します。今回使用したデータは以下です。
トマト | キャベツ | 人参 | じゃがいも | 玉ねぎ | |
---|---|---|---|---|---|
2024/3/1 | 71 | 21 | 81 | 23 | 69 |
2024/3/2 | 34 | 83 | 81 | 79 | 23 |
2024/3/3 | 91 | 79 | 66 | 33 | 21 |
2024/3/4 | 80 | 40 | 81 | 28 | 25 |
2024/3/5 | 40 | 52 | 70 | 72 | 73 |
2024/3/6 | 94 | 95 | 74 | 21 | 23 |
2024/3/7 | 94 | 77 | 83 | 79 | 73 |
2024/3/8 | 43 | 41 | 22 | 90 | 82 |
2024/3/9 | 22 | 68 | 70 | 63 | 37 |
2024/3/10 | 41 | 78 | 26 | 27 | 63 |
2024/3/11 | 72 | 61 | 40 | 66 | 53 |
2024/3/12 | 21 | 79 | 92 | 54 | 93 |
2024/3/13 | 49 | 99 | 58 | 97 | 81 |
2024/3/14 | 57 | 34 | 37 | 55 | 33 |
分析で利用するExcel関数(VBAコード)を生成する
Excelデータの分析で必要となるVBAコードを生成する必要があります。ChatGPTに先の項目でExcelデータを読み込ませたら、ChatGPTにプロンプトを入力します。
たとえば、以下のプロンプトを入力してみてください。
「入力したデータは、とある八百屋で売れた野菜の個数を14日間記録したものです。各野菜の平均個数を算出し、平均個数以下のセルを赤く塗りつぶすVBAコードを生成してください。」
すると以下のような結果が返ってきます。
Sub ColorBelowAverage()
Dim ws As Worksheet
Dim dataRange As Range
Dim vegRange As Range
Dim avg As Double
Dim i As Long, j As Long
' 使用するワークシートの名前を設定します。適宜変更してください。
Set ws = ThisWorkbook.Sheets("売上")
' データが存在する範囲を設定します。この例では、2行目から15行目まで、そしてB列からI列までと仮定しています。
' 実際のデータに応じて範囲を調整してください。
Set dataRange = ws.Range("C2:G16")
' 列ごとにループを実行し、平均値を計算後、条件に合うセルを塗りつぶします。
For i = 1 To dataRange.Columns.Count
Set vegRange = dataRange.Columns(i)
avg = Application.WorksheetFunction.Average(vegRange)
For j = 1 To vegRange.Cells.Count
If vegRange.Cells(j).Value <= avg Then
' 平均以下の値を持つセルを赤く塗りつぶす
vegRange.Cells(j).Interior.Color = RGB(255, 0, 0)
Else
' 平均を超える値の場合は、塗りつぶしをクリア (必要に応じて)
' vegRange.Cells(j).Interior.ColorIndex = xlNone
End If
Next j
Next i
End Sub
生成したコードを使い分析する
入力したデータのExcelファイルを開き、VBAエディタを開きます。
開き方は、「Alt」+「F11」が便利です。VBAエディタの左メニューから分析するExcelファイルを選びます。
左メニューの「コードの表示」を選択し、白いウィンドウにVBAコードを貼り付けます。
最後に実行ボタンかF5を押して、手順は完了です。
なお、ChatGPT×Excelについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【ChatGPT×Excel】最強プラグイン2選やExcelと連携する方法を解説
生成AIを使用してデータ分析をしよう!
生成AIは、従来のAIとは異なり、文章や画像、動画など新しいコンテンツを作成可能です。データ分析にこれを活用すると、人件費削減や作業時間の短縮、新しいアイデアの提供などのメリットがあります。
しかし、生成AIを使う際には、誤った情報や不正確なデータに基づいて分析するリスクがあります。これは「ハルシネーション」と呼ばれ、間違った結果に導く可能性があるため、情報の正確性を確認することが重要です。
正しく生成AIを活用すれば、業務の効率化や新しいビジネスが可能になります。ぜひ、生成AIの活用を検討してみてください!
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。