生成AIとは？従来のAIとの違いや仕組み、メリット・デメリット、企業活用事例をわかりやすく解説

2025-05-262025-06-13

最近話題の生成AIですが、従来のAIとは何が違うのか疑問に思っている方も多いのではないでしょうか。

また、興味をもったものの、どのようなサービスに生成AIが搭載されているのか、どのようなことができるのかといった内容を知りたい方も多いはずです。

そこで本記事では、生成AIの「種類」「仕組み」「できること」「代表的なサービス」などの基本事項を解説します。最後まで読めば、生成AIの基礎を把握でき、最新のAI動向を素早くキャッチできるようになります。

＼生成AIを活用して業務プロセスを自動化／

【無料】専門家に相談する

生成AIとは？簡単に解説

生成AIとは、簡単に述べると大量のデータを基に新しいコンテンツを作り出す人工知能の一種です。

たとえば、たくさんの人の顔画像を訓練データとしてAIモデルを学習した場合、それらの画像に似た新しい顔画像をAIが生成できるようになります。このAI技術には、元データの特徴を捉えるために「確率分布」という数学的な手法を用いています。

生成AIはこの確率分布を利用して新しいデータを「サンプリング」つまり、選び出すことで、似たような新しいデータを生成できるというわけです。

参考：https://www.bigdata-navi.com/aidrops/2941/

近年では、深層学習という手法を採用することにより、さらにリアルな画像データや音声データを生成できるようになりました。深層学習を使うAIモデルのことを「深層生成モデル」と呼びます。

深層生成モデルの例には、GAN（敵対的生成ネットワーク）やVAE（変分オートエンコーダー）などがあります。これらはより複雑なデータを扱うために特別に設計されたモデルです。

GANやVAEについては、この後で出てくる「生成AIの仕組み」のなかで詳しく解説します。

従来のAIとの違いをわかりやすく解説

AIと呼ばれる技術の存在は以前から広く知られていますが、生成AIは従来のAIと何が違うのでしょうか。これまでのAIは、将来の予測を行う、正誤を判定するなどAIモデルが学習した内容を基に自動化するのが目的でした。電子メールのスパム判別、画像認識、市場の需要予測などがその一例です。

一方、生成AIは過去判定や予測だけでなく、データから学習した内容を基に新しいコンテンツを作成できます。新しいテキストや画像、音声などを自ら新たに生成することができるのがAIとの違いです。

従来のAI：AIに新しく画像を認識させ、その画像が「犬」か「犬以外」かを判別する
生成AI：「犬」のような画像を新たに生成する

例えば、犬の画像をAIモデルに学習させた場合の両者の違いは上記の通りです。この時、両者は上記のような使い分けができます。わかりやすく言えば、データをグループごとに分けるのを得意としているのが「識別系AI」、データを新たに生成するのを得意としているのが「生成系AI」となります。

代表モデル（GPT・GAN・拡散モデルなど）と技術トレンド

生成AIの代表モデルは、GPT・GAN・拡散モデルなどがあります。

GPT：事前に大量のデータを学習させることで、人間のように自然な文章を生成できる高精度なAIモデル
GAN：対立する2つのネットワークが競い合いながら高品質な画像を生成するAIモデル
拡散モデル：ノイズの追加と除去を通じて高精細な画像を生成する進化型AIモデル

それぞれのモデルは、テキストや画像を生成する仕組みが異なるため、自分の用途に適したモデルを選ぶのが大切です。テキストや画像生成を幅広くこなせるモデルを求めるなら、GPTがおすすめです。

なお、近年では、AIエージェントや高度な推論をこなす推論モデルが技術トレンドとなっています。

AIエージェント：自律的に判断・行動し、タスクを遂行するモデル
推論モデル：より深い考察により専門性の高いタスクをこなせるモデル

より専門性の高いタスクをこなす場合は推論モデル、単純作業を効率化したいならAIエージェントを活用しましょう。

今なぜ注目されているのか？

生成AIが今注目されているのは、人間に匹敵する文章・画像・音声などを自動生成でき、あらゆる業界で創造的業務の効率化や革新が期待されているからです。

さらに具体的には以下のような背景があります：

技術の進化：GPTや拡散モデルなど、高精度な生成AI技術が登場し、クオリティが飛躍的に向上している
アクセスのしやすさ：ChatGPTや画像生成ツールなど、誰でも簡単に使えるサービスが普及している
ビジネス応用の拡大：広告、デザイン、企画、プログラミングなど、幅広い業務に応用され始めている
コスト削減と生産性向上：人間の手間を大幅に減らし、人件費の削減が期待できる

このように、生成AIは単なるツールにとどまらず、社会や仕事のあり方そのものを変える可能性がある技術として注目されています。

生成AIが開発された経緯

生成AIは、元々は研究機関や大手テクノロジー企業によって開発されました。

2014年頃に登場した「GAN（Generative Adversarial Network）」という技術が、その発展の大きな起点となっています。

GANは、2つのAIが互いに競い合いながら学習し、リアルな画像や映像を生成するという新しい方法で、多くの分野に大きなインパクトを与えました。

生成AIの仕組み

生成AIの仕組みを理解するうえでは、Transformerや生成プロセスを理解することが大切です。また、生成には複数のモデルが存在するため、それぞれのモデルに対する理解と使い分けが求められます。以下では、生成AIの仕組みをわかりやすく解説するので、ぜひ参考にしてみてください。

Transformerとは？

Transformerとは、2017年にGoogleの研究者が発表したニューラルネットワークの一種で、自然言語処理の分野に革新をもたらした技術です。機械翻訳などの系列変換タスクを目的に開発され、後にChatGPTなどの生成AIの基盤技術としても注目を集めました。

最大の特徴は「Attention Mechanism」によって、文章中の文脈や重要な単語の関係を高精度かつ高速に処理できる点。並列処理が可能で長文にも強く、従来のモデルに比べて優れた性能を発揮します。

生成プロセス（サンプリング／プロンプトの重要性）

生成AIがコンテンツを生み出す際には、「プロンプト（入力文）」と「サンプリング（出力の選択）」が大きな役割を果たします。プロンプトはAIへの指示文であり、その内容や表現によって出力結果の質や方向性が大きく変わります。

一方サンプリングは、学習済みモデルが多数の候補の中からどのような出力を選ぶかを決めるプロセスです。温度（temperature）や確率分布などのパラメータを調整することで、創造性の高い応答から精度重視の応答までコントロールできます。

このように、適切なプロンプト設計とサンプリング手法の工夫によって、生成AIの出力品質は大きく向上します。

モデルの種類（表付き）

生成AIには、以下のように複数のモデルが存在します。

スクロールできます

モデル	特徴	仕組み
回帰モデル	数値を予測	適切な直線を引く
分類モデル	クラスを予測	適切な決定境界を引く
クラスタリング	データをグループ分け	データ間の類似度を計算
主成分分析	データの情報量を圧縮	分散が最大となる方向を軸としてデータを変換
GPT	文章の次単語予測・生成	Transformerのデコーダを事前学習
VAE	データの特徴を表現する潜在変数を求めてデータを生成	オートエンコーダを利用して、潜在変数に確率分布を用いる
GAN	2つのニューラルネットワークを用いてデータを生成	識別器と生成器を競わせてデータを学習
拡散モデル	画像を生成	ノイズの追加と除去を通じて高精細な画像を生成
AIエージェント	自律的に判断・行動し、タスクを遂行する	環境から情報を取得し、自律的に判断・行動を繰り返すことで目標を達成する
推論モデル	より深い考察により専門性の高いタスクをこなす	Web上の数百の情報源から関連情報を収集・分析する

代表的なものとして、文章生成に強いGPTシリーズ、画像生成で注目されるGANや拡散モデルなどが挙げられます。

それぞれのモデルは特徴や得意分野、使われる技術が異なるため、目的に応じて適切なモデルを選択することが重要です。

なお、GPTの代表格であるChatGPTにできることを知りたい方は、以下の記事をご覧ください。

あわせて読みたい

ChatGPTができること・できないこと一覧！最強の生成AIツールが向いている＆苦手なことを解説これまでに実施されてきたアップデートによって、多くのことができるようになったChatGPTですが、「逆に何ができないの？」と気になっている方も多いのではないでしょう…

生成AIでできること

生成AIは多様な分野で活用され、クリエイティブなコンテンツ制作から業務効率化まで幅広く貢献しています。文章や画像、音声、動画などさまざまなコンテンツを自動で生成できるため、新しい価値やアイデアを生み出す力が飛躍的に向上しました。以下では、生成AIでできることを業務別やタスク別に紹介していきます。

業務別ユースケース

生成AIでできることを業務別にまとめました。

マーケティング：広告コピー作成
カスタマーサポート：電話の自動応答
企画：商品デザインのアイデア出し
プログラマー：プログラムコード生成
教育：教育コンテンツの作成
医療：医療データの分析支援

生成AIは、単純な質問への自動応答、アイデア出しや分析などのタスクで本領を発揮します。幅広い業界での活用が進んでいるので、まだ活用していない方はぜひ使ってみてください。

テキスト／画像／音声／動画／マルチモーダル別に紹介

生成AIでできることをタスク別にまとめると、以下のようになります。

テキスト：記事やメール文の自動生成
画像：リアルなイラストや写真の創作
音声：ナレーションや合成音声の生成
動画：短編映像やアニメーションの作成
マルチモーダル：画像と文章を組み合わせた説明文やキャプションの自動生成

上記のモデルは、単体で使用しても効果を発揮しますが、それぞれ組み合わせることでより豊かで多様なコンテンツ制作が可能になります。

今後も技術の進歩により、より高度で自然な表現が期待されています。

生成AIの代表的なサービス（種別×サービス）

生成AIの代表的なサービスを以下にまとめました。

テキスト生成：ChatGPT・Claude
画像生成：Stable Diffusion・Midjourney
音声：Voicery・Coee
動画生成：Runway・Pika
マルチモーダルAI：ChatGPT・Gemini

なかでも、ChatGPTは生成AIが注目される原因となった有名なサービスです。テキスト生成だけでなく、画像生成や動画生成など幅広いタスクをこなせるマルチモーダルAIとして利用できます。

それぞれのサービスに異なる強みがあるため、特定のタスクをこなす際は該当のサービスを利用してみてください。

生成AIの導入メリットとできないこと

生成AIは多くの場面で高い生産性と創造性を発揮しますが、すべてを万能にこなせるわけではありません。

ここでは、導入によって得られる主なメリットと、逆に生成AIが不得意とする領域、また利用にあたって注意すべきリスクとその対策について解説します。

メリット

生成AIの最大の魅力は、大量のタスクを瞬時にこなせる点にあります。文章・画像・音声・コードなどを短時間で自動的に作成できるため、作業時間を大幅に減らすことが可能です。

また、アイデア出しや試作の段階でも役立ち、人の発想を助けるサポートツールとしても活用できます。24時間稼働できる点も、業務効率化を図るうえでのおおきなメリットです。

できないこと・苦手な領域

生成AIができないのは、最新情報への対応です。最近では、Webブラウジングによりある程度最新情報を集められるようになりましたが、まだまだ出力したテキストに古い情報が紛れていることがあります。

また、専門的・倫理的な判断が求められる内容や、法律・医療など正確性が重要な領域では、人間によるチェックが不可欠です。さらに、創作物の「オリジナリティ」や「意図のある表現」といった、感性や価値判断が求められる場面でも限界があります。

リスクとその対策（セキュリティ、ハルシネーション）

生成AIを導入する際には、セキュリティと信頼性に関するリスクも考慮する必要があります。代表的なリスクとしては、事実とは異なる情報をあたかも正確なように出力する「ハルシネーション（幻覚）」や、機密情報を含むプロンプトの誤入力による情報漏洩などが挙げられます。

これらのリスクに対する対策としては、以下のような取り組みが有効です。

出力内容を必ず人間が確認・検証するプロセスを設ける
機密データを入力しないよう、運用ルールを明確化する
利用するAIツールに対して、セキュリティポリシーの適合性を確認する
高精度な生成が求められる業務には、補完的に専門家の判断を加える

これらの対策を徹底することで、安全かつ効果的に生成AIを活用することが可能になります。

他の技術との違い

スクロールできます

技術	特徴
生成AI	新しいコンテンツを自動で生成
機械学習	過去のデータから傾向を学習して予測や分類を行う
識別AI	画像や音声を識別することに特化

生成AIは、「自動で新しいコンテンツを生み出す」点が最大の特徴です。これは、過去のデータから傾向を学習して予測や分類を行う機械学習や、画像や音声などの入力を「識別」することを目的とした識別AI（判別モデル）とは大きく異なります。

例えば、識別AIが「これは猫か犬か」を見分けるのに対して、生成AIは「猫の画像をゼロから作り出す」ことができます。つまり、情報を「判別するAI」から「創り出すAI」へと進化しているのが、生成AIの位置づけです。

上記の表では、それぞれの技術の目的や役割の違いをわかりやすく比較しています。用途や導入目的に応じて、適切な技術を選ぶことが重要です。

企業で導入するには？

生成AIを企業で導入する際は、いきなり本格展開するのではなく、段階を踏んで進めることが重要です。業務や体制に合った活用方法を見極めながら、小さく始めて大きく展開しましょう。以下では、導入の基本的な流れと、社内説明の際に押さえておきたいポイントを解説します。

導入フロー5ステップ（PoC → 社内展開）

生成AIを企業に導入する際は、以下の5ステップで進めます。

目的の明確化
生成AIを使って「何を改善したいのか」「どの業務を効率化したいのか」を明確にします。目的があいまいだと効果を測れず、活用が定着しません。
対象業務の選定
まずは少人数で運用できる業務や、試験的に効果を測定しやすい業務を選びます。例：マニュアル作成、FAQ対応、SNS投稿案の作成など。
PoC（概念実証）の実施
小規模なテスト導入で、実際にどの程度の効果やリスクがあるかを検証します。使用感や出力精度、業務へのフィット感を確認するフェーズです。
運用体制の整備
本格導入前に、利用ルールや情報管理の方針、チェック体制などを整備します。必要であればマニュアルや教育コンテンツを作成します。
社内展開・スケールアップ
PoCの成果をふまえ、社内全体へ展開します。部署ごとのニーズに応じた活用方法やトレーニングも重要です。

上記はPoCがうまくいった場合のケースですが、うまくいかなかった場合は再度前の段階に戻り、目的や対象業務を見直します。PDCAサイクルを回しながら、生成AIの導入を進めましょう。

社内説明のためのチェックポイント

生成AIの導入を社内で進めるには、関係者の理解と協力が不可欠です。以下のようなポイントを押さえて説明すると、スムーズに合意を得やすくなります。

導入目的と期待できる効果は何か（時間短縮・コスト削減など）
既存業務とどう連携するか（どこに取り入れ、誰が使うのか）
出力結果の確認方法や責任の所在（人間の最終チェック体制）
セキュリティや機密情報の扱いはどうするか
生成AIにできること・できないことの線引き

上記を整理して伝えることで、現場との認識ギャップを防ぎ、安心して運用をスタートできます。

なお、生成AIの社内導入マニュアルを確認したい方は、以下の記事をご覧ください。

WEEL

生成AI社内導入マニュアル！具体的な導入方法、注意点、メリットを解説 | WEEL 生成AIを導入する方法を解説します。すでに多くの企業が生成AIを業務に取り入れ生産性を向上させています。競合に負けないために生成AIを活用することは、今後のビジネスに…

国内の生成AIの活用事例

生成AIの導入に向けて、不安や課題もあるでしょう。具体的な活用事例を知ることで導入イメージがより明確になり、今後の検討に役立ちます。ここでは、ビジネスでの活用事例を150個紹介します。

事例①コカ・コーラ（情報検索システムの導入）

コカ・コーラでは、AIを使用した情報検索システムが新たに導入されました。

ユーザーの要求に応じて、社内のさまざまなデータファイルから必要な情報を抽出し情報提供を行っています。AIを活用することでより効率的に情報提供できるため、顧客満足度の向上にもつながるでしょう。

また、AIを活用して制作されたアート作品のプラットフォームも立ち上げています。（※8）

事例②オルツ（ゲーム開発）

オルツは生成AIを使用して、脱出ゲーム「きまぐれな部屋」を生成しました。「きまぐれな部屋」は、密室に閉じ込められたキャラクター「アイ」とチャットでコミュニケーションを取って親密度を高め、脱出を手助けするゲームです。（※9）

このゲーム内のチャットにはAI技術が使われています。オルツのWebサイト「altBRAIN」から実際にプレイできるので、興味のある方は一度プレイしてみてください！

事例③パナソニック（自社向けAIアシスタントサービス）

パナソニックは、業務効率化と社員のAIスキル向上を目的に、自社向けAIアシスタントサービス「ConnectAI」を展開しています。このサービスは、OpenAIの大規模言語モデルのChatGPTを基に構築されており、自社の公式情報を活用しています。特に注目すべき点は、このAIアシスタントが提供する機能の多様性です。（※10）

社内の情報提供はもちろんのこと、セマンティック検索技術を採用することで、従来のキーワード検索より精度の高い検索結果を実現しています。また、音声入力や回答の引用元表示機能の開発により、社員はより簡単に情報を検索し、その回答の真偽を確認できるようになっています。

さらに、2023年10月以降はカスタマーサポートセンターでの利用も計画されています。AIの活用により、顧客からの問い合わせに対してスピーディーな対応が可能になり、顧客満足度の向上にもつながることでしょう。

事例④アサヒビール（社内情報検索システム）

アサヒビールは、株式会社丹青社と連携し、生成AIを社内情報検索システムに導入しました。このシステムは、社内の豊富なデータベースからPDF、Word、PowerPointなどの異なる形式の資料をデータ化し、検索可能にすることで業務効率化を目指しています。（※11）

「Azure Cognitive Search」と「Cosmos DB」を使用することで、検索結果には資料の概要、サムネイル、100文字程度の要約が表示されるようになっています。

また、異なる形式の文書を統合的に扱うことができるため、情報検索の手間を大幅に削減し、よりスムーズな業務運営が期待できます。

事例⑤旭鉄工株式会社（改善事例の蓄積と共有）

旭鉄工では、生成AIを活用して製造現場の改善事例を蓄積し、共有しています。従業員が簡単に必要な情報を収集できるような仕組みを作り、ChatGPTにノウハウ集の内容を読み込ませることで、自然言語での質問に対して最適な改善事例を回答できるようにしました。（※12）

旭鉄工は愛知県で自動車の金属加工部品を製造しており、IoT（モノのインターネット）を活用したシステムを自社で開発し大きな成果を上げています。特に注目すべきは、2015年度比で年間約4億円の労務費削減と、電力消費量の26％削減に成功している点です。

また、旭鉄工は「横展アイテムリスト」と呼ばれる改善のノウハウ集を作成したことで、改善方法が属人的に管理される問題を解消し、早期の問題対策と人材育成を実現しています。

このリストでは、「要らなくする」「待ちを短くする」「同時に行う」などの上位概念を設定し、改善活動のアイデア出しに活用しているそうです。

事例⑥江崎グリコ株式会社（AIチャットボットでバックオフィス業務を削減）

江崎グリコ株式会社は2023年3月より、Allganize Japan株式会社が提供するAIチャットボット「Alli」を導入しています。（※14）バックオフィス部門での問い合わせ業務削減を目的に導入し、年間1万3000件以上発生していた問い合わせを約31％削減したとのことです。

なお、数あるAIチャットボットのなかから「Alli」を選んだのは、ITに詳しくない方でも容易にメンテナンスできるためです。一部の人間にしか扱えないシステムを導入しても、業務の属人化が進んでしまうので、こういった姿勢は見習いたいですね！

事例⑦ヤマト運輸株式会社（生成AIで配送業務量を予測）

ヤマト運輸株式会社は2021年8月より、生成AIを活用した配送システムを導入しています。（※15）これは、アルフレッサ株式会社との共同によるもので、ヘルスケア商品の共同配送スキームを構築する際に開始したものです。

導入したのは、配送業務量を予測するシステムと適正配車を支援するシステムの2つ。生成AIが蓄積しているビックデータから、販売・物流・商品・需要トレンドを分析できるのが特徴です。

分析したデータは、顧客毎の注文数・配送発生確率・納品時の滞在時間などを予測するのに役立てられます。過去のデータに基づいて予測するといった業務は生成AIの得意とするところなので、ぜひ活用していきたいですね！

事例⑧パルコ（広告動画やナレーション、音楽を生成AIで作成）

パルコは画像生成AIを活用し、ファッション広告を作成しました。この広告では、実際の人物や場所を使った撮影を行わず、生成AIにプロンプトを入力して制作されました。そのため、グラフィックや動画、ナレーション、音楽などすべて生成AIが作成したものです。(※16)

実際に撮影したかのようなこの広告は、世界中からも注目され、モード間のある新しい表現の広告と言われています。企業として前例のない新しい技術をいち早く取り入れることも、企業としての存在意義であると考えているとパルコでは考えられており、今後の動向には注目です！

事例⑨株式会社ビズリーチ（生成AIを活用した職務経歴書の作成でスカウト率の向上）

転職プラットフォームの株式会社ビズリーチは、2023年7月6日、転職に必要な「職務経歴書」を生成AIで作成できる機能を発表しています。希望する職種やポジション、業務領域などを選択や記述するだけですぐに職務経歴書を完成させられるようになりました。(※17)

転職活動では、転職希望者のスキルや経験を言語化し、文章化するのがハードルになっているため、転職が思うように進まないケースが多いといいます。この機能では、入力項目は4か所のみとなっているため、簡単に職務経歴書ができるのが特徴です。実際にこの機能を使うことで、スカウト率が40%も向上したという結果も出ています。

事例⑩株式会社学研ホールディングス（生成AIによる個別アドバイス提供）

株式会社学研ホールディングスは、ChatGPTを活用し、オリジナル学習システム「GDLS」を2023年7月12日に提供を開始しました。このシステムは、生徒一人一人の学習履歴や理解度に基づいて適切なアドバイスを提供できるものとなっています。(※18)

さらに、学習アドバイスを行うだけでなく、毎日ログインする習慣を促すように生徒一人ひとりに合わせたメッセージを送ってくれます。この結果、学習意欲の向上もできるようになったのです。

事例⑪出光興産

出光興産は、先進マテリアル部門にて生成AIを導入しています。※27

具体的には、検索拡張生成（RAG）の活用に注力することで、分析レポートの作成や技術サポートの業務を大幅に効率化したとのことです。

なお、同社が今回生成AIを導入できたのは、元々生成AIワーキンググループを立ち上げて生成AIの活用法を模索していたのが大きいと考えられます。

将来的に生成AIを導入したいと考えているなら、同社のように、社内全体で事前に生成AIへの理解を高めておきましょう。

事例⑫キリンホールディングス株式会社

キリンホールディングス株式会社は、自社グループが開発した生成AIツール「BuddyAI」を国内従業員約1万5,000人向けに提供しています。※28

おもにマーケティングにおける情報収集や市場分析に活用しており、先行導入したテスト版は400人が利用して年間合計39,000時間の削減を達成できたとのことです。

今回の成功の裏には、生成AIを利用する全従業員を対象としたEラーニングの導入や、「DX道場」での生成AI関連講座の拡充が大きいといえます。

事例⑬住友商事

住友商事は、Microsoftが提供している「Copilot」を全社で導入し、今では9,000人以上が利用しています。※29

おもな使い道は、メールの下書き・資料の作成・Web会議の要約などです。

なお、多くの企業が小規模で導入してから情報に利用を拡大させていきますが、同社の場合は最初から全社向けに大きく展開しています。

これは経営層のコミット力の高さが大きな要因となっているので、スピード感を持って生成AIを導入したい方は、経営層を巻き込むことを意識してみてください。

事例⑭ライフネット生命保険

ライフネット生命保険は、社内用生成AIを独自に開発しており、2025年1月時点で全社員の87%が利用しています。※30

導入から2ヶ月で利用者の計152時間の業務時間を削減するといった、大きな成果をあげました。

同社が実施した社内調査によるとアイデアの壁打ちや情報の調査、数式やプログラムの記述といった用途で使用しているとのことです。

事例⑮明治安田生命保険

明治安田生命保険は、営業活動を支援する目的でAIエージェント「MYパレット」を社内に導入しています。※31

約36,000人が利用しており、顧客の属性を分析したり、顧客のライフステージに合わせたサービスを提案する用途で使用しているとのことです。

その結果、報告業務や訪問前の準備にかかる時間を従来比で30%削減することに成功しています。

海外の生成AI活用事例

続いて、海外の生成AI活用事例について紹介します。

スターバックス
Uber Eats
Amazon
Netflix
Gucci
Google
H&M
Mastercard

国内とはまた違った視点で活用されているケースもあるので、生成AIを導入する際の参考になるはずです。

以下でそれぞれの事例を詳しくみていきましょう。

スターバックス（ビッグデータを店舗運営に活用）

世界に3万を超える店舗を出店しているスターバックスでは、顧客との取引が膨大に発生する強みを活かして、生成AIやビッグデータを店舗運営に活用しています。（※19）

顧客データを集めるのは容易ではありませんが、スターバックスはスマホアプリやリワードプログラムで効率的に集めているのが特徴です。

集めたデータは、顧客におすすめの飲み物を提案したり、新店舗の場所を決める際に使われたりします。

とくに、スターバックスは多くの店舗を抱えているため、既存店舗との兼ね合いを生成AIが判断してくれるのはかなり便利ですよね！

Uber Eats（AIアシスタントが注文プロセスを支援）

Uber Eatsは、アプリ内にAIアシスタントを導入することで、顧客の注文プロセスを支援しています。（※20）具体的には、新しい食事のアイデアを提案してくれたり、お得な情報を探して提案してくれるのが特徴です。

また、過去に注文した食事を再注文してくれる機能もあります。いちいち自分で店舗を検索する手間がなくなるので、これはかなり便利ですね！

なお、モデルには、Google PaLMを使用して構築しつつ、独自に微調整した大規模言語モデルを使用しています。

Amazon（生成AIでサプライチェーンを最適化）

Amazonは、配送業務を効率化するために、さまざまな場所で生成AIを活用しています。（※21）商品を適切な場所に保管するサプライチェーン最適化テクノロジー（SCOT）がその一例です。

SCOTには、ディープラーニングと膨大なデータセットが用いられており、1日に4億以上の商品の需要予測をサポートしています。これにより、膨大な数の商品の出荷量を調整し、Amazonのどの拠点でどの商品を仕入れるのかを決定しているとのことです。

Netflix（画像生成AIでアニメを制作）

Netflixは、試験的な取り組みとして画像生成AIを活用してアニメ制作をおこないました。（※22）「犬と少年」と名付けられた3分の短い動画作品をYouTubeに公開し、SNS上で大きな反響を呼んでいます。

もちろん、クオリティに関する批判の声もいくつか確認されており、制作側も画像生成AIの限界に直面したとコメントしています。

なお、Netflixがアニメ制作で画像生成AIを活用したのは、アニメ業界全体が抱える人手不足の問題を解決するためです。今回は背景画の作成を生成AIに任せたとのことですが、実際は生成AIが思い通りの絵を描いてくれることはなかったようです。

Gucci（生成AIが購入履歴に基づきおすすめ商品を提案）

世界的なファッションブランドとして知られるGucciも生成AIを活用しています。（※24）顧客の購入履歴に基づいておすすめの商品を提案できるので、顧客の購買意欲が高まったようです。

実際、顧客に生成AIを使っておすすめの商品を提案したところ、より多くのものを買ってくれたという報告もあります。生成AI導入後は、一夜にして売上高が30%向上したという衝撃発言も出ているので、かなり効果があったようです。

Google（医療画像の診断や疾患を生成AIで予測）

Googleは医療診断の精度の向上を目指して、医療用AIツールを開発しました。医療用AIツールは「CoDoC」と呼ばれており、AI予測と医師の診断結果を組み合わせて、医療提供者の負担を軽減することも目的の1つとしています。(※24)

実際には「乳がん検診の偽陽性の削減」で25%の削減に成功したことや臨床医の読影が必要な症例数を3分の2削減に貢献しているという結果がでました。CoDoCは外部パートナーと協力し、システムの向上を行う予定としています。

H&M（生成AIがファンショントレンド予測と在庫管理の効率化提案）

ファッションブランドであるH&Mは、生成AIを使いトレンド予測とそれに合った在庫管理の効率化に成功しています。200人を超えるデータサイエンティストを雇用し、独自のAIアルゴリズムを作成することで、売れ残りによる余剰在庫を減らすことに成功しました。(※25)

Mastercard（生成AIで不正利用の検出率を2倍に向上）

クレジットカードの国際ブランドであるMastercardでは、生成AIの利用で不正利用の検出率を従来の2倍に向上させることに成功しました。それ以外にも不正取引検知の誤検知を最大200%削減するだけでなく、悪意のある人物によって危険にさらされている加盟店を特定する速度が300%向上したと発表しています。(※26)

クレジットカード利用者が安心して使えるようになるのは嬉しいですよね。生成AIは我々の生活をより安全なものにする使い方もできるため、活用の幅は広いと言えるでしょう。

Electronic Arts

アメリカの大手ゲームソフト会社であるElectronic Artsは、アメリカのカレッジフットボールを題材とした「EA SPORTS College Football 25」の制作過程で生成AIを活用しています。※32

具体的には、AIを用いて11,000人の大学生を3Dスキャンし、ゲーム内キャラクターの作成に活かしているとのことです。

近年、グラフィックやキャラクター作成に生成AIを利用する動きが高まっていますが、今後もさらに活発になっていきそうですね！

VISA

VISAは、Visa Global Product DropにてVisa Intelligent Commerceを発表しました。※33

この取り組みは、ユーザーの代わりに商品を検索して購入するエージェント型AIショッピング体験の実現を目的としているとのことです。

目的の実現に向けて、カードの詳細をトークン化されたデジタル認証情報に変換する「AI対応クレジットカード」の提供も予定しています。

生成AIの使い方

生成AIを使う際には、入力と出力の関係を理解することが重要です。

例えば、テキストから画像を生成する生成AIでは「木の下で眠っている猫」というテキストを入力すると、AIはその情報に基づいた画像を生成してくれます。

以下の表は、生成AIがどのように機能するかの一例です。

スクロールできます

機能	入力	出力
チャットボット	テキスト	テキスト
テキストから画像生成	テキスト	画像
テキストから音楽生成	テキスト	音楽
音声翻訳	音声	音声
画像からキャプション付与	画像	テキスト

特に、ChatGPTのような入力が「テキスト」のAIでは、プロンプトと呼ばれる入力文が重要です。なぜなら、プロンプトの書き方によってAIの出力精度が大きく左右されるからです。

例えば「明日の天気は？」と尋ねると、AIはあなたの現在地に基づいた天気予報を答えます。一方で「明日の東京の天気は？」と具体的に尋ねると、よりユーザーの意図に合った天気予報を答えてくれるでしょう。

プロンプトが具体的になるほど、生成AIは正確かつ関連性の高い回答を返します。

生成AIを利用するメリット

生成AIを利用するメリットは、おもに以下の5つです。

業務の効率が上がる
アイデア出しがスムーズにできる
ミスの削減や予防に役立つ
高度な知識や技術を必要とするタスクを誰でもこなせる
データ収集や分析を効率的にできる

とくに、業務の効率向上に大きく貢献できるのが魅力です。アイデア出しなどで活用すれば、商品やサービス開発をスムーズにおこなえます。

また、コーディングタスクなどで使用することで、ミスの削減や予防に役立つのも特徴です。データ収集や分析も得意としているので、マーケティング戦略などにも活かせます。

生成AIを利用するデメリット

便利な生成AIですが、以下のようなデメリットも存在します。

間違った情報を出力する可能性がある
情報が古い可能性がある
生成したコンテンツが著作権侵害に該当する可能性がある
入力した情報が漏洩してしまう危険がある

よくあるのが、間違った情報や古い情報を出力してしまうケースです。これはモデルの学習次第で異なるのですが、多くの生成AIは学習した時点の情報までしか正確に答えられません。

また、生成した画像や動画が著作権侵害に該当する可能性もあるので注意しましょう。モデルによっては、入力した情報が漏洩してしまう危険もあるので、社外秘の情報を無闇に入力しないことが大切です。

生成AIの種類

生成AIの種類は多岐にわたります。ここでは、主要な生成AIの種類とその特徴、代表的なサービスを紹介します。代表的な生成AIは、以下の通りです。

スクロールできます

AIの種類	特徴	代表サービス
テキスト生成	テキストを理解し、それに合わせたテキストを生成できる	ChatGPT
画像生成	テキストなどの条件をもとに、画像データを生成できる	MidjourneyDALL-E
動画生成	テキストなどの条件をもとに、動画を生成できる	SoraRunway
音声生成	音声や音楽を生成できる	AudioPaLM
マルチモーダル	複数の種類のデータを統合的に処理できる	SeamlessM4TChatGPT

それぞれの詳細について、順番にみていきましょう。

テキスト生成

テキスト生成AIは、機械学習と自然言語処理技術を利用し、人間が理解できる自然なテキストを生成する技術です。テキスト生成AIは、コンテンツ作成・レポート作成・チャットボットの対話など、さまざまなアプリケーションで使用されます。

テキスト生成AIの精度は、使用されている言語モデルによって異なります。AIモデルが学習するデータの質や量に依存し、例えば英語や日本語など言語の情報量によっても精度は違うでしょう。世界で最もよく使われている英語の回答精度は、他の言語の回答精度より高い傾向にあります。

ChatGPTなどでは、まるで人間が答えを返しているかのような高精度な回答が可能です。

画像生成

画像生成AIとは、テキストやデータを入力することで自動的に新しい画像を生成する技術です。DALL-E 3のような画像生成AIは、学習元となる画像をAIツールに入力すると入力画像をAIが学習し、それらの画像の特徴を持った全く新しい画像を生成します。

大量の画像データを学習に使えるため、画像生成AIはAI技術の中でも特に進化の速い分野です。最近の画像生成AIツールはどれも精度が高いので、ぜひ一度使ってみてください！

動画生成

動画生成AIは、自動的に動画を作成する技術です。現状、一般公開はされていないですが、2024年2月にOpenAI社が公表した新しいText-To-Videoモデルの「Sora」は世界に新たな衝撃を与え、現在最もホットな分野のひとつです。テキストや画像などの情報を入力すれば、映像や音声を組み合わせて新しい動画を生成します。

動画生成AIは、映画制作・広告・教育コンテンツ・ゲーム開発・報道など幅広い分野で活用され、PoC開発にも役立っています。例えば、特定のキーワードやテーマに基づいたプロモーションビデオの自動生成などが可能です。

さらに、3Dアニメーションや仮想現実（VR）コンテンツの生成やリアルタイムでの動画編集など、より複雑なタスクに対応できるようになってきています。

特にSoraは、画像を入力としてアニメーション化する、動画を入力して動画の一部を編集する、複数の動画をつなげるなどの複雑で高度な作業も自動化できます。

音声生成

音声生成AIは、音声入力やテキスト入力を基に新たな音声を生成する技術です。例えば、ある一人の声を大量に学習させると、その声質を再現した声でさまざまな文章を自由に話す音声を生成します。

また、音声生成AIを用いれば、音楽の自動生成も可能です。例えば、プロンプトで「エモいLo-fiの曲を作って」と入力すると、そのテキストに沿った音楽を簡単に生成できるツールもあります。

マルチモーダルAI

マルチモーダルAIとは、テキスト・画像・音声・動画など、人間の脳のように複数の種類の情報（モーダル）を一度に処理・解析できるAI技術です。従来のAI技術では、テキストや音声など1種類の情報だけを処理可能でした。これを「シングルモーダルAI」といいます。

これに対してマルチモーダルAIは、複数のデータ形式を統合して高度な生成を実現します。ChatGPTはもともとテキスト生成のみに対応するシングルモーダルAIでしたが、2023年12月のGPT-4V実装により画像解析機能と音声出力機能が追加され、マルチモーダルAIになりました。

なお、マルチモーダルAIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

あわせて読みたい

マルチモーダルAIとは？その意味や特徴、活用事例を詳しく解説近年、AIモデルのなかでも、特に高い注目を浴びているマルチモーダルAIがどんな種類の生成AIなのかをご存知でしょうか。マルチモーダルAIは、画像とテキストの組み合わ…

生成AIの機械学習について

生成AIには、機械学習という技術が大きく関係しています。機械学習とは、機械（コンピューター）が大量のデータをインプットしてデータの集合の中に存在するパターンを発見・認識する技術です。

機械学習の代表的な手法は、以下の4つです。

教師あり学習
教師なし学習
強化学習
深層学習（ディープラーニング学習）

生成AIの中核となるAIモデルにも機械学習の手法が用いられており、ChatGPTのGPTでは深層学習という手法を用いています。

スクロールできます

大カテゴリ	小カテゴリ	特徴	仕組み	活用例・代表サービス
教師あり学習	回帰モデル	数値を予測	適切な直線を引く	不動産や株価の価格予測
教師あり学習	分類モデル	クラスを予測	適切な決定境界を引く	画像分類
教師なし学習	クラスタリング	データをグループ分け	データ間の類似度を計算	顧客のセグメンテーション
教師なし学習	主成分分析	データの情報量を圧縮	分散が最大となる方向を軸としてデータを変換	身長と体重からBMIへの変換
強化学習	–	タスクの報酬を最大化	プログラムが与えられた環境を観測し、より価値のある行動を学習	囲碁AIや将棋AI
深層学習	GPT	文章の次単語予測・生成	Transformerのデコーダを事前学習	ChatGPT
	VAE	データの特徴を表現する潜在変数を求めてデータを生成	オートエンコーダを利用して、潜在変数に確率分布を用いる	人の顔画像の編集
	GAN	2つのニューラルネットワークを用いてデータを生成	識別器と生成器を競わせてデータを学習	DALL・E
	拡散モデル	ノイズ除去によるデータ生成	データにノイズ付与した後、ノイズ付与の過程を学習させる	Stable Diffusion

教師あり学習（Supervised Learning）

ここでは、機械学習の一手法である教師あり学習について解説します。教師あり学習とは、既知の入力データと出力データを「正解」としてAIモデルを訓練し、学習したルールやパターンを基に未知のデータの出力を予測する手法です。

教師あり学習には「回帰モデル」と「分類モデル」があります。それぞれについて詳しく見てみましょう。

回帰モデル

回帰モデルとは、連続値の入力を用いて将来や未知の事例を予測する教師あり学習の一手法です。ある結果に関連する要因がどの程度影響を与えているかを、以下のように関数の形で明らかにします。

上記の散布図は、ある地域における住宅価格と駅からの距離の関係を表したものです。横軸が「駅からの距離」、縦軸が「住宅価格」です。

駅からの距離が遠くなるほど、住宅の価格は下がることが分かります。駅に近いと移動に便利なので、その分価値が高いということですね。

結果を数値化したものを「目的変数」といい、要因を数値化したものを「説明変数」といいます。この例では、住宅価格が目的変数、駅からの距離が説明変数です。

分類モデル

分類モデルは、入力データを属性ごとに分類したいときに使用されるモデルです。異常値検出や画像診断、スパムフィルタなどに活用されます。

例えば、正解データを使って学習したルールやパターンを基に受信したメールがスパムメールかどうかを判別し、スパムフォルダに入れるなどの効率化に役立ちます。

参考：https://best-biostatistics.com/summary/kyoushi.html

2つのカテゴリに分類する場合は「2値分類」、2つ以上のカテゴリに分類する場合は「多値分類」と呼びます。

教師なし学習（Unsupervised Learning）

続いて教師なし学習について解説します。

正解データを訓練データとして学習に使う教師あり学習とは違い、正解データを与えずにAIモデルを学習させる手法です。入力データ群から似たような特徴を持つデータをグルーピングする、データの特徴量（変数）を少ない特徴量で表してデータを扱いやすくするなどの活用法があります。

ここでは、「クラスタリング」と「主成分分析」について詳しく解説します。

クラスタリング

クラスタリングとは、AIモデルがデータから特徴を学習し、類似性に基づいてグループ化する手法です。クラスタリングによってできたグループのことを「クラスタ」と呼びます。ウォード法やk-meansなどの手法があり、以下の図はk-meansの例です。

クラスタリングは分類モデルと似ていますが、訓練に正解データを使う分類モデルに対して、クラスタリングでは正解データは利用しません。

主成分分析

主成分分析（PCA）は、データの特徴量（説明変数）を削減し、新たな説明変数（主成分）にすることでその内容を理解しやすくする分析手法です。分散が最大となる方向を見つけ出し、新たな軸としてデータを変換します。データの次元を減らせるため、データ解釈が容易になります。

参考：https://www.intage.co.jp/glossary/401/

例えば、上図のような6教科の成績（多次元のデータ）をそれぞれ文系と理系の成績（2次元のデータ）に変換するなどの処理が可能です。

強化学習（Reinforcement Learning）

強化学習とは、AIモデルが試行する度に報酬を与え、思考錯誤を繰り返して報酬を最大化するような意思決定の仕方を学習させる手法です。試行が適切であるほど高い報酬を与えるため、AIモデルは次第に報酬を高くする方法を学んでいきます。

参考：https://www.sbbit.jp/article/cont1/49076

強化学習の目的は、環境変化に対応できるAIモデルを構築することです。刻一刻と状況が変化する中で最適な判断が必要となる、自動車の自動運転システムなどに活用されています。強化学習には、Q学習やモンテカルロ法などの手法が用いられています。

深層学習（Deep Learning ディープラーニング）

深層学習は、人間の脳の神経回路の仕組みを模してAIモデルの学習能力を高める手法です。入力に対して重みづけしたデータを出力するニューロンを、何層にも重ねたものをディープニューラルネットワークと呼びます。

「教師あり学習」「教師なし学習」「強化学習」の3つは、人間が目的に適した手法を選ぶ必要がありますが、深層学習では、人間が介在しなくてもAIモデルが学習の過程でデータの特徴を認識できます。

音声・画像・自然言語処理など抽象的なデータに対する処理性能が高く、2000年代末から2010年代にかけて急速に普及しました。ここでは、深層学習を用いたAIモデルを紹介します。

GPT

GPT（Generative Pre-trained Transformer）は、OpenAI が開発した大規模言語モデルです。

Transformerと呼ばれる2017年にGoogleが公表した大規模言語モデルのデコーダ部分を利用しており、高度な文章生成能力や複雑な文章理解力を有しています。GPTはChatGPTに実装されているAIモデルです。

2024年4月時点で最新のGPT-4 は、GPT-3やGPT-3.5 の上位モデルです。一回あたりに入力できる質問の文字数は日本語で最大25,000 文字、出力の応答長は2048単語で、長文にも対応しています。

変分オートエンコーダ（VAE：Variational Autoencoder)

VAEは、学習したデータの特徴を捉え、類似の画像を生成する生成モデルです。データの高次元分布を低次元の「潜在変数」にマッピングするために用います。

参考：https://zero2one.jp/ai-word/variational-autoencoder/

エンコーダとデコーダという2つの要素から構成され、まずエンコーダで入力画像を潜在変数に変換し、その後デコーダにより潜在変数から新しい画像を生成します。

VAEは、潜在変数が確率分布に従うように設計されたモデルです。新しいデータを生成したり、欠損データを補完したりする際により柔軟なモデリングが可能になりました。

GAN（Generative Adversarial Network）

参考：https://zero2one.jp/ai-word/generative-adversarial-network/

GANは「生成器（Generator）」と「識別器（Discriminator）」という2つのニューラルネットワークを競わせながら、データを学習させる生成モデルです。

生成器：識別器をだますようにデータを生成
識別器：「本物のデータ」か「生成器によって作られたデータか」を見分ける

生成器と識別器の違いは上記の通りです。

拡散モデル

拡散モデルは、画像やテキスト・音声などのコンテンツを段階的に劣化させた後、劣化の過程をさかのぼり、再構築する過程を学習させた生成モデルです。

下図は、右から左にかけて画像にノイズを加えた後、次に左から右にかけてノイズを除去しています。拡散モデルにも色々なモデルがあり、下図は「DDPM」という種類の拡散モデルです。

GANやVAEよりも高品質の画像を生成することに成功しており、様々な分野への応用が期待されています。Transformerに次ぐ画期的な生成モデルとして今後も目が離せない分野です。

生成AIにできること・できないこと

生成AIを活用するには、生成AIを使ってできること・できないことを把握することが重要です。

スクロールできます

生成AIにできること	生成AIにできないこと
フィクションの世界創造	芸術作品等の主観的評価
自動ブレインストーミング	五感の活用
自動プログラミング	独創性のある生成
メールやレポートの自動生成	長期記憶
自動要約	曖昧な物事の理解

上記の表はほんの一例ですが、生成AIの特性を知らないまま利用すると、期待していた回答を得られない可能性があるので、何ができて何ができないのかを事前にしっかり把握しておきましょう。

生成AIにできること・得意なこと

生成AIは、プロンプトで指示を出すことで人間が作ったような新しいコンテンツを簡単に生成できます。例えば、フィクション作品を書くことや新しいアイディアの創出、さらには、メールの返信などの面倒な作業も効率化できます。

このように、生成AIはクリエイティブな活動から分析的な作業まで、多岐にわたる領域で作業の効率化を支援します。生成AIを活用すれば、これまで人間が手作業で行っていたタスクを自動化し、時間とコストの削減に役立つでしょう。

生成AIにできないこと・苦手なこと

生成AIは主に「計算可能な、明確に定義されたタスク」において強い一方で「主観性、感覚、独創性、長期記憶、曖昧性」など、人間が持つ能力や感性に関連する領域では基本的に弱いといえます。

これからのAI時代に向けて、人間は「生成AIにできないこと・苦手なこと」の能力を伸ばしていくことが重要です。

【無料あり】生成AIの代表的なサービス

スクロールできます

生成AIサービス	AIの種類	開発会社	機能・特徴	HP
ChatGPT	マルチモーダル	OpenAI	テキストでプロンプトを入力すると、その内容に沿ったコンテンツが生成される	https://chat.openai.com/
Midjourney	画像生成	デビット・ホルツ氏の研究チーム	テキストでプロンプトを入力すると、その内容に沿った画像が生成される	https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F
Runway	動画生成	Runway	テキストから動画を生成する	https://runwayml.com/
AudioPaLM	音声生成	Google	音声認識・翻訳・音声合成が可能	https://google-research.github.io/seanet/audiopalm/examples/
SeamlessM4T	マルチモーダル	Meta	音声とテキストを用いて翻訳および文字起こしを行う	https://ai.meta.com/blog/seamless-m4t/
Stable Diffusion	画像生成	Stability AI	テキスト入力で高品質な画像を生成できる	https://ja.stability.ai/stable-diffusion
DALL-E3	画像生成	OpenAI	ChatGPTに搭載されている画像生成AI	https://openai.com/index/dall-e-3/
Gemini	マルチモーダル	Google	Googleのさまざまなサービスと連携できる	https://gemini.google.com/app?hl=ja
Llama3	マルチモーダル	Meta	さまざまなタスクをこなせるオープンソースのLLM	https://github.com/meta-llama/llama3
Adobe Firefly	画像生成	Adobe	テキストから画像を生成	https://www.adobe.com/jp/products/firefly.html
Canva	画像生成	Canva Pty Ltd	テキストから画像を生成	https://www.canva.com/

生成AIを利用できるサービスの例もご紹介します。テキストベースのツール、画像を生成できるツール、動画を作れるツールなど便利なサービスが数多くリリースされています。たくさんの種類があるので、気になるサービスがあったらぜひ使ってみてください。

ChatGPT

ChatGPTは、OpenAI社が2022年11月に公開したAIチャットボットです。インターネット上に存在する大量のデータを学習し、人間が生成するような自然なテキストを生成できる大規模言語モデル（LLM）です。ユーザーが入力した質問に対して、自然な対話形式で答えてくれます。

最近では、音声や画像、動画の生成も可能になり、マルチモーダルAIとして進化を遂げました。

ChatGPTは、基本的に無料で利用できますが有料版と比べて制約があり、モデルの性能は劣ります（GPT-3.5）。有料のアップグレード版であるChatGPT Plus / Team / Enterpriseでは月額$20〜で、最新のGPT-4が利用可能。さらに生成AIツールが自作&共有できるGPTsも解放されます。

日本語や英語以外にも、スペイン語・中国語など、さまざまな言語に対応しています。

あわせて読みたい

ChatGPTとは？できること・使い方・仕組み・注意点をわかりやすく解説！ ChatGPT（チャットジーピーティー）とは、米OpenAI社が開発したチャット型AIサービスのことです。2022年11月に登場してからわずか2ヶ月で1億ユーザーを獲得するなど、世…

Midjourney

Midjourneyは、テキストプロンプトから画像を作成する画像生成AIです。Discordというチャットアプリから、チャット形式で操作して利用します。アメリカのデビット・ホルツ氏の研究チームが開発したAIで、Twitter上でMidjourneyの画像が拡散され話題を集めました。

テキストを入力すると、そのキーワードや文章に適したイラストや画像を生成します。例えば「猫」と入力すると、猫の画像が生成されます。

あわせて読みたい

Midjourney（ミッドジャーニー）とは？料金体系や始め方、使い方を解説みなさんは、誰でも簡単に息をのむような美しいイラストが作れる画像生成AI「Midjourney」をご存知ですか？実際にMidjourneyで生成した画像を、米コロラド州の美術品評…

Runway

Runwayは、テキストから動画を生成する生成AIツールの開発をしている企業です。Stability.AIとの協力により「Stable Diffusion」という、テキストから画像を生成するAIも開発しています。Runwayは2023年、Google、Nvidia、Salesforce Venturesなどから1億4,100万米ドルの資金調達に成功しました。（※1）

ツールの利用は無料で、アカウントを作成しプロジェクトを立ち上げるだけで誰でも簡単に動画編集を行うことができます。

あわせて読みたい

【プロクオリティ】最新のRunway Gen-4とは？特徴や使い方・料金・プロンプトのコツも解説！動画制作に革命が来た…！？ Runwayが新たに発表した「Gen-4」をご存知ですか？Runway Gen-4は、AI技術を駆使して、これまで以上にリアルで一貫性のある映像生成を可能に…

AudioPaLM

AudioPaLMはGoogleによって開発された音声認識と音声生成に特化した大規模言語モデル（LLM）です。テキストと音声の両方を処理・生成する能力を持ち、テキストベースのLLM「PaLM-2」と音声ベースのLLM「AudioLM」を統合したモデルです。

AudioPaLMの特徴は、音声を入力すると声色やイントネーションなどのパラ言語情報を抽出・保持できる点です。大量の多言語データセットで学習したPaLM-2の言語知識を活用しており、短い音声データを基に話者の声を別の言語に変換することもできます。

この技術が進化すれば、音声チャットや多言語対話をより自然に行えるでしょう。

あわせて読みたい

【AudioPaLM】Googleの神音声AIツール、導入から使い方まで解説皆さん、Google が新しく発表したAudioPaLMというモデルについてご存知ですか？これは、Googleが発表した音声に関係するモデルですが、どのように世の中が変わるのでし…

SeamlessM4T

SeamlessM4Tは、Metaが発表したマルチモーダルAIモデルです。約 100 の言語のテキストと音声を認識し、翻訳結果をテキストまたは音声で出力できます。音声出力に対応する言語は、日本語を含む 36 言語です。

SeamlessM4T は、265,000 時間に及ぶ音声とテキストのアライメントを収集したマルチモーダル翻訳データセット「SeamlessAlign」とともに公開されました。

あわせて読みたい

【SeamlessM4t】Metaの多言語翻訳AI、使い方から実践まで徹底解説 Facebook（現Meta）社が、マルチモーダルな音声AI SeamlessM4Tを発表したんだとか。「どんなことができるんだ」、「精度はいいのか」と気になりました。そんなことで、…

Stable Diffusion

Stable Diffusionは、テキストから高品質な画像を生成できる画像生成AIの一種です。とくに、細部まで精密に描ける点が魅力で、従来の画像生成AIよりも高解像度の画像を短時間で生成できます。

オープンソースとしても公開され、多くのクリエイターが自分の好みに合わせてカスタマイズしたり、新たな創作活動に活用しています。Webブラウザ上やローカル上など、ニーズに合わせてさまざまな使い方ができるので、ぜひ試してみてください。

あわせて読みたい

【無料も可】今から始める画像生成AI「Stable Diffusion」の使い方！プロンプトのコツや活用事例を初心… Stable Diffusionは、入力されたテキストや画像を基に、自動で新しい構成の絵を生み出す画像生成AIです。リリースからたったの一年で1,000万以上のユーザーを集め、約6…

DALL-E3

DALL-E 3は、OpenAIが開発した最新の画像生成AIモデルです。おもに、ChatGPTに搭載されており、チャット形式でテキストを入力すると指示に応じた画像を生成できます。

前バージョンのDALL-E2よりも、指示をより正確に理解し、複雑なシーンや概念をより自然に描写できるように進化しているのが特徴です。簡単なテキスト入力で、プロレベルの画像を生成できるため、クリエイティブなプロジェクトやデザイン業務において大きな可能性を秘めています。

あわせて読みたい

DALL-E 3とは？使い方・日本語対応・プロンプトのコツまでやさしく解説皆さんはDALL-E 3をご存じですか？ 2023年9月21日にOpenAI社から発表された最新の画像生成AIで、ChatGPTを使って画像を生成することができるんです！従来のものから大幅…

Gemini

Geminiは、Google DeepMindが開発した次世代の生成AIモデルです。とくに、自然言語処理やマルチモーダルなタスクに優れた性能を発揮します。

また、大規模なデータセットを基に、テキスト生成・翻訳・対話などの複雑な言語タスクを高い精度でこなすのが特徴です。GoogleのAI技術の最先端を象徴するモデルとして注目を集めています。

GメールやGoogleマップなど、Googleの各種ツールと連携するとさらに便利に使いこなせるので、ぜひ試してみてください。

あわせて読みたい

Gemini（旧Google Bard）で画像生成はできる？最新の画像生成機能や利用方法なども解説 Googleは、大規模言語モデルであるLaMDA（Language Model for Dialogue Applications）を搭載したチャットボット「Bard」を開発し、Webから幅広い情報を収集して要約す…

Llama3

Llama 3は、Meta（旧Facebook）が開発した大規模言語モデルで、自然言語処理において高い性能を有しています。Llamaシリーズの第3世代として、テキスト生成や質問応答、翻訳などのタスクでさらに高精度な結果を提供できるのが特徴です。

オープンソースで利用できるため、研究者や開発者がモデルを自由にカスタマイズできます。さまざまな用途に活用できるため、生成AI分野における幅広い応用が期待されています。

あわせて読みたい

【Llama 3.3】コスパ最強のMeta最新LLM！3.1と比較すると意外な結果に 2024/12/7、Metaから新たなLLM「Llama3.3」がリリースされました。 Llama3.3は少ない推論コストで従来のLLM同様、トップクラスのパフォーマンスと性能を提供。Metaによ…

Adobe Firefly

Adobe Fireflyは、テキスト入力から画像生成できる生成AIです。写真やイラストを作成したり、テキストを編集したりと、デザインに役立つ様々なツールがそろっているのが特徴です。

たとえば、画像を生成するために「青い空に浮かぶ風船」といったテキストを入力すると、その内容に基づいた画像が作成されます。さらに、色の調整や背景の削除といった編集作業もAIがサポートします。PhotoshopやIllustratorなどのAdobe製品と連携しているため、デザイン初心者からプロまで、誰でも簡単にビジュアルコンテンツを作成することができ、人気の高い生成AIです。

あわせて読みたい

Adobe Fireflyとは？使い方や料金、画像生成のコツを徹底解説皆さんは画像生成AIツールを活用していますか？今回はその中でも特におすすめな「Adobe Firefly」をご紹介します。 Adobe Fireflyとは、様々なクリエイティブ・マーケ…

Canva

Canvaは、誰でも簡単にデザインを作成できるオンラインツールです。ポスター、SNS投稿、プレゼンテーションなど様々な用途に対応したテンプレートが豊富に用意されており、初心者でも直感的に操作できます。

テキストや画像、図形をドラッグ＆ドロップで配置し、すぐにデザインが完成します。最近では、生成AIを活用してテキストを入力するだけでグラフィックが作成できる「マジックデザイン」機能も追加され、さらに手軽に高品質なデザインが作れるようになりました。

あわせて読みたい

　【Canva AIの使い方】著作権や商用利用、注意点を徹底解説 WEELメディア事業部リサーチャーのいつきです。突然ですが、みなさんはグラフィックデザインツールのCanvaに生成AI機能が実装されていることはご存知でしょうか。なん…

生成AIの国内における動向

生成AIの日本国内における動向を見てみましょう。PwC Japan、IDC Japan、NHKの3社の調査結果を基に解説します。

生成AIの普及と認知度の向上

PwC Japanの調査によると、2024年春における自社の生成AI活用の推進度合いと他社での活用(他者事例)への関心度は、半年前の秋に比べて向上しています。推進度合いは9%、他社での活用の関心度は4%増加しました。（※2）

また、2023年春時点では73%の回答者が社内における生成AIの活用推進度合を「わからない」もしくは「導入検討していない」と回答していたのに対し、1年後には91%が「活用中」「推進中」もしくは「検討中」と回答しています。

そして2023年秋に世界各国のCEOを対象に行った調査では、「業務での生成AI受け入れに同意する」と回答した割合が世界で40%未満であったのに対して、日本で50%という結果に。とくに、

ヘルスケア・病院・医薬・医療機器
自動車
重工業・産業機械・家電

の業界で世界に先駆けて生成AI活用が進んでいる、ということが明らかになりました。（※3）

これらの結果から、近年急速に生成AIのビジネスへの導入や活用が進んでいると推測できます。

企業における生成AIの活用

IDC Japanが2023年に実施した調査によると、日本国内の生成AIに対する期待が世界よりも高いことが示されています。生産性向上に役立つ社内向けの用途（コード生成、会話型アプリケーションなど）への期待が高い一方で、マーケティングアプリケーションへの期待は世界と同様に比較的低い傾向にあります。（※4）

参考：2023年生成AIに関する企業ユーザー動向調査（国内と世界の比較）分析結果を発表

上図は、生成AIに対する企業の対応状況を調査した結果です。調査は2023年3月と7月に2回実施され、それぞれの結果を日本企業と日本以外の国（アジア、北米、欧州）で分けて示しています。

選択肢は、左から「まだ何もしていない」「可能性のある分野について検討を開始した」「2023年に生成AI技術に投資する/している」の3つです。青いバーは世界の企業（2023年3月）、水色は世界の企業（2023年7月）、緑は日本企業（2023年3月）、黄緑は日本企業（2023年7月）を表しています。

どの企業も3月に比べて検討や投資は進んでおり、何もしていないと回答した企業は3月よりも大幅に減っています。全体的に日本も世界の企業も同じ傾向にあるといえるでしょう。

国産生成AIの開発動向

日本国内での生成AI開発も進んでいます。NHKの報道によると、豊富な日本語学習データを強みとした国産生成AIの開発が進められており、さまざまな分野での応用が期待されています。

技術者や研究者の待遇改善が課題となっており、長期的な視点での研究環境の整備が必要とされています。（※5）

生成AI関連ビッグテックの日本参入

2023年末から、生成AI関連企業の日本参入が続々と発表されています。

まず2023年12月には、生成AI用のGPUを手がけるNVDIAのファンCEOが日本への研究拠点設置を表明。国産LLMの開発に追い風が吹きました。（※6）

さらに2024年4月には、OpenAIがアジア初のオフィス・日本支部「OpenAI Japan」の立ち上げを発表し、現在は東京都六本木にオフィスを構えています。。社長は、かつてAWSジャパンで日本にクラウドサービスを浸透させた長﨑忠雄氏。日本の生成AI文化の発展が期待されています。（※7）

生成AIの今後の展望と課題

生成AIは素晴らしい可能性を持っていますが、いくつかの課題もあります。例えば、以下のような点が挙げられます：

品質のばらつき：生成されたコンテンツの品質が安定しないことがあります。
著作権問題：生成されたデータが他の著作物を模倣している場合、法的な問題が発生することがあります。
誤情報のリスク：AIが誤った情報を生成し、それが事実であるかのように広まるリスクもあります。

日本企業における生成AIの積極的な活用は、国際競争力を高める重要な要素となるでしょう。さらなる認知度の向上や専門人材の育成、適切なガバナンス体制の整備が今後の重要な課題です。

国産生成AIの開発では、日本独自の文化や言語を反映させることが、グローバルな競争において重要な差別化要因となります。

生成AIをビジネスで活用する方法

生成AIは、ビジネスにおいて以下のような活用例があります。

ブログのタイトル作成
キャッチコピー作成
メール文の作成
文章の要約
プログラミングのコード生成
自動応答チャットボットの構築
ビジネスのトレンド調査
顧客エンゲージメントの向上

生成AIの活用により、作業時間を短縮でき作業者の負担も減らせるため、業務の効率化につながります。また、新しいアイデアを着想する、新しい視点からの洞察を得られることもあるでしょう。

以下で、活用例を具体的に紹介していきます。

ブログのタイトル作成

生成AIを使えば、ブログのタイトル作成を効率化できます。試しにChatGPTを使って、ブログのタイトルを作成してもらいました。

プロンプトで数を指定することで、希望に応じた数量のタイトルを提案してくれます。自分で何もない状態からタイトルを考えるのは時間がかかりますが、これなら必要な部分を修正するだけなので、すぐにタイトルが完成しますね！

キャッチコピー作成

生成AIならキャッチコピーの作成も容易です。キャッチコピーを作成する商品やサービスのイメージを伝え、希望の条件を指定するだけで簡単に作成できます。

キャッチコピーも人間が何もない状態から作ろうとすると、簡単には思い浮かびません。生成AIがいくつかの案を出して、それを選ぶのもいいですし、対話を重ねながらよりよいキャッチコピーにしていくのもおすすめです。

メール文の作成

生成AIは、メール文の作成にも活用できます。筆者もChatGPTを使って、試しにメール文を作成してみました。

文章を考える手間が省けるのはもちろん、タイピングの手間も省けます。請求書用のメールなど、ついテンプレ化されやすいメールは生成AIに任せてもよいかもしれません。

文章の要約

生成AIを使えば、文章の要約も可能です。たとえば、難しい内容の論文や研究レポートなどを要約すると、内容を理解しやすくなります。

これは理解が難しい場合に便利なのはもちろん、長文を読んでいる時間がない時などにも有効です。ただし、要約の精度は使用するモデルの性能に依存するので、ChatGPTなどの高度な大規模言語モデルを使用するのがおすすめです。

プログラミングコード生成

生成AIなら、プログラミングコードも瞬時に生成できます。試しに、ChatGPTでプログラミングコードを生成してみました。

今回は、生成AI情報を発信するサイトのホームページといったかなり抽象的な指示だったのですが、しっかりとプログラミングコードを生成してくれています。

もっと具体的な指示を与えれば、かなり有用性は高そうです。

自動応答チャットボットの構築

生成AIを使えば、自動応答チャットボットの構築も可能です。チャットボット生成サービスにはさまざまなものがありますが、代表的なのはChatGPTのGPTsです。

チャットボットの構築にプログラミングの知識は必要なく、基本的にはチャット形式で対話を重ねることで完成します。チャットボットに必要なデータを学習させれば、自社のお問い合わせ用に使えるので、使い方次第で業務効率を大きく向上できます。

ビジネスのトレンド調査

生成AIは、大量のデータを瞬時に処理し、業界の最新動向や消費者の嗜好を分析する能力があります。この能力を活用することで、業界のトレンド調査を効率化できます。

たとえば、SNSやニュース記事を解析して、新興の市場ニーズや注目される技術を特定する使い方もあります。マーケティング戦略や商品開発に反映することで、迅速に市場の変化に対応可能です。

顧客エンゲージメントの向上

生成AIは、顧客エンゲージメントの向上にも大いに貢献可能です。生成AIを活用することで、個々の顧客の行動や嗜好を分析し、パーソナライズされたコンテンツや提案を自動で生成できます。

これにより、顧客は自分に合った製品やサービスに出会いやすくなり、満足度が向上するというわけです。また、顧客とのコミュニケーションも円滑になり、ブランドへの忠誠心が高まる効果も期待できます。

生成AIの危険性や問題点

生成AIは幅広く活用でき便利な反面、危険性も潜んでいます。ここでは、生成AIの問題点・危険性についてご紹介します。

情報漏洩のリスク

生成AIを利用する際には、情報漏洩のリスクに注意する必要があります。生成AIは入力された情報をもとに学習するため、そのまま使用すると個人情報や機密情報であっても同様に学習されてしまうのです。可能性は低いものの、情報が不正利用されることも考えられます。

情報の信憑性

ChatGPTは、インターネット上の情報を活用して回答を生成しています。ただし、このためにChatGPTの回答の正確性は保証されておらず、誤った情報源に基づいて誤った回答が生成される可能性もあります。生成された回答は必ずしも最新のものとは限りません。

誤った情報を使用することで実務上の問題が生じたり、企業の信頼性に影響を与えたりする可能性もあるため注意が必要です。

著作権侵害

ChatGPTが生成する回答には、個人情報保護や著作権に関連する情報が含まれる可能性もあります。これらの情報を無意識に引用してしまうことで、法的な問題が発生する可能性もゼロではありません。

ChatGPTを利用する際には慎重に注意し、法的な観点からも適切な引用と情報利用が行われるよう留意することも重要です。生成AIの利用に関しては、このように様々な課題もあり、総務省を中心に議論が進められている状況です。（※13）

生成AIの危険性への対処法

生成AIの危険性を解説しましたが、リスクに対してどのように対応していけば良いのでしょうか？　次に、生成AIを取り扱う上で重要な「危険性への対処法」をご紹介します。

情報漏洩への対策

ChatGPTの場合は設定変更により、情報漏洩のリスクを回避できます。データの学習を防ぐには、以下の3つの方法が有効です。

「training」を無効にする
ChatGPT APIを利用する
オプトアウトの手続きを行う

ChatGPTの設定を開き、「Data controls」をタップすると、「Chat history & training」が表示されます。これをオフにすることで、入力したデータの学習を停止させることができます。また、ChatGPT APIを介して生成されたデータは、AIの学習に使用されません。

他にも、OpenAIが提供しているオプトアウトの制度を利用することで、AIが入力したデータを学習しないようにできます。リクエストは「User Content Opt Out Request」から送信できます。

情報の信憑性への対策

ChatGPTによって生成された情報の正確性を確認することが重要です。ChatGPTの回答を即座に採用するのではなく、他の人間による確認を組み込んだシステムを構築しましょう。

専門的な情報を扱う場合は、専門家のチェックを導入するとより安心です。より正確性を高めるためには、誤った情報や有害なコンテンツを生成しないようにするためのチェック機能を導入するなどの対応も求められます。

著作権侵害への対策

ChatGPTの使用に関するガイドラインや情報漏洩の予防策を策定する必要があります。これには、適切な利用法や避けるべき行動についての詳細な情報を記載します。それによって、知らないうちに著作権を侵害してしまうような事態を回避できるでしょう。

また、生成されたコンテンツがAIによるものであることを明確にするためのラベル付けも有効です。

なお、ChatGPTを企業利用するリスクと対策について詳しく知りたい方は、下記の記事を合わせてご確認ください。

あわせて読みたい

ChatGPTを企業利用するリスクと対策6選！実際の企業事例と共に解説 2024年6月現在、ChatGPTはビジネスのあらゆるシーンで活用されてきています。しかし、ChatGPTを業務に活用する上で、当然情報漏洩や著作権侵害などのリスクも存在します…

最後に

いかがだったでしょうか？

生成AIがもたらす可能性は無限大。貴社のプロジェクトに適した活用方法を見つけ、未来の競争力を模索してみてください。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです！

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70％自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80％削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

無料で相談する

資料をダウンロードする

参考記事

※1：AI Video Startup Runway Raises $141 Million From Google, Nvidia
※2：生成AIに関する実態調査2024 春
※3：第 27回 CEO意識調査生成 AI日本分析版
※4：2023年生成AIに関する企業ユーザー動向調査（国内と世界の比較）分析結果を発表
※5：国産生成AIの開発進む「豊富な日本語の学習データが強み」 | NHK
※6：米エヌビディア、日本に研究拠点設置へ　AI人材育成も
※7：Introducing OpenAI Japan
※8：Create Real Magic™
※9：オルツのノーコードBRAIN生成プラットフォーム「altBRAIN」で、AIが生成した脱出ゲーム制作に成功
※10：パナソニックコネクトのAIアシスタントサービス「ConnectAI」を自社特化AIへと深化
※11：生成AIを用いた社内情報検索システムを導入
※12：製造業での活用〜カイゼンノウハウは生成AIに聞け！〜
※13：生成AIを巡る議論/総務省
※14：Allganize、Glicoグループのバックオフィス効率化をAIチャットボット「Alli」で支援
※15：ビッグデータ・AIを活用した配送業務量予測および適正配車のシステム導入について
※16：「HAPPY HOLIDAYS広告」が、AMDアワードで「優秀賞」を受賞
※17：ビズリーチ「GPTモデルのレジュメ自動作成機能」を開発
※18：学研オリジナル学習システム（GDLS）でChatGPTを活用し、生徒の学習効果を最大化する個別アドバイスを提供開始
※19：ビッグデータ・AIを活用するスターバックスのビジネス実例
※20：Uber Eats AIアシスタント
※21：AmazonがAIを活用してホリデーシーズンのお買物体験をより良いものにし、商品をより迅速に配送するためにアメリカで行った5つの方法
※22：Netflixが｢画像生成AIでアニメ制作｣してわかったAIの限界…『犬と少年』で挑戦したもの
※23：SalesforceベニオフCEO、生成AI製品導入後のグッチが「一夜にして売上高30％増」と衝撃発言
※24：Developing reliable AI tools for healthcare
※25：AIを活用した在庫管理の事例5選｜3大メリットや注意点も紹介
※26：Mastercard accelerates card fraud detection with generative AI technology※27：出光興産、先進マテリアル部門で生成AI導入–RAG活用で分析レポート／技術サポート業務を効率化
※28：キリングループの生成AIツール「BuddyAI」を国内従業員約1万5,000人に展開拡大、部門別特化に向けて次のフェーズに移行
※29：住友商事は経営層肝煎りのCopilot導入で年12億円削減、生成AIを全社で使い倒せ
※30：ライフネット生命保険　社内用生成AIの利用率は87%となり社員の生産性向上を実現　導入から2ヶ月で利用者の業務時間を計152時間削減
※31：明治安田生命、全社での生成AI活用視野に営業職3万6000人が使うAIエージェントを導入
※32：EAがAIを使ってわずか3カ月で1万1000人分の大学アメフト選手をスキャンしてゲームに実装することに成功
※33：Ready for AI-enhanced credit cards? Here’s Visa’s vision of automated shopping

【監修者】田村洋樹

株式会社WEELの執行役員として、AI導入支援や生成AIを活用した業務改革を中心に、アドバイザリー・プロジェクトマネジメント・講演活動など多面的な立場で企業を支援している。

これまでに累計25社以上のAIアドバイザリーを担当し、企業向けセミナーや大学講義を通じて、のべ10,000人を超える受講者に対して実践的な知見を提供。上場企業や国立大学などでの登壇実績も多く、日本HP主催「HP Future Ready AI Conference 2024」や、インテル主催「Intel Connection Japan 2024」など、業界を代表するカンファレンスにも登壇している。