【生成AIトレンドマガジン】SunoやLeonardo.AI、Channel1 AIなど先週話題になったAIツールを8個紹介
WEELメディア事業部AIライターのたけしです。
近年のAI業界の進化はすさまじく、AI関連の最新情報が毎日のように流れてきますよね。
最近だと、歌詞を入力するだけでオリジナルの曲が自動で作成できるAIツールが公開され、話題を集めました。スゴすぎる…!!
今回はAIの最新情報にキャッチアップできていない方向けに、2023年12月現在、世界中で注目を集めている最新のAIツール8選を紹介します。
最後までご覧いただき、気になるツールがあればぜひ実際に使ってみてください!
【Suno】歌詞からオリジナル曲を自動で生成
「Suno」は、歌詞を入力するだけでオリジナル曲を自動で生成できるAIツールです。
Sunoの大きな特徴は、以下の5点です。
- 高速生成:ユーザーが入力した歌詞から、数秒で音楽を生成できる
- 多機能なオーディオ生成:ボーカルとバックトラックを含む約30秒間の音楽が生成できる
- 曲調を指定:ロックやバラードなど、曲調の指定もできる
- Discordとの連携:Discordのコミュニティ上でも利用でき、操作もしやすく、かつ他のユーザーと作品の共有もできる
- 高度なカスタマイズ性と操作性:生成された音楽は自由にカスタマイズでき、完全オリジナルの曲を作れる
Sunoの使い方は簡単で、歌詞と曲調を入力するだけ。
試しにChatGPTで作成した以下の歌詞を入力し、曲調をバラードにしてみると…
荒野のような心、風に吹かれて、若き日々の叫び、空へと響け
夢追う足跡、消えぬようにと、疾風のように駆ける、この街を抜けて
挑む目には、未来の光、でも心の中、嵐が渦巻く
強く生きるための、叫び声高く、荒れる若者、時代を変える
以下の曲がものの数秒であっという間に完成しました。
しかもクオリティが普通に高い!!
Sunoには無料プランと有料プランがあり、無料プランなら1日5曲まで作成できます。
興味のある方は、ぜひ試してみてください!
なお、Sunoについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Suno AI】テキストだけで曲、歌詞、歌声を作れる禁断の音楽生成AIの使い方〜実践まで
【Gemini Pro API】Gemini ProをAPI経由で独自に活用可能
2023年12月13日、Google社は「Gemini Pro API」を公開しました。
これにより、企業や開発者がGemini ProをAPI経由で独自に活用できるようになったのです!
そもそもGeminiとは、Google社が開発した最新型のマルチモーダルAIの名称です。
- Ultra・Pro・Nanoの3種類のサイズがあり、それぞれに最適な用途がある(※1)
- GPT-4と性能を比較した研究において、全32項目の評価指標のうち30項目でGPT-4よりも優れている(※2)
- 理数・人文科学の性能を測る指標(MMLU)では、人間の専門家を超えるパフォーマンスを発揮した(※3)
- テキスト・画像・音声・動画すべてのデータに対応できる(※4)
- 1. Ultraは2024年初頭に公開予定、ProはGoogle Bardに導入、NanoはPixel 8 Proに搭載
- 2~4. いずれもGemini Ultraの特徴
Gemini Pro APIは、「Google AI Studio」もしくは「Vertex AI」で利用できます。
2023年現在、Gemini Pro APIは1分あたり最大60クエリまで無料で利用可能です。(無料期間は2024年初頭まで、それ以降は課金制)
興味のある方は、ぜひGemini Pro APIを試してみてください!
なお、Gemini Pro APIについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Gemini Pro API】使い方や料金体系、GPT-4Vと比較してみた結果も解説
【Channel1 AI】AIだけで制作されたニュース配信
「Channel1 AI」は、AIだけで制作されたニュース配信の名称です。
百聞は一見にしかず、まずは以下の動画を見てください。
何の違和感もない、普通のニュース配信に見えますよね?
実はこれ、なんとすべてAIだけで制作されているのです!ヤバいですよね…
そんなChannel1 AIの大きな特徴は、以下の3点です。
- キャスター:AIだけで生成。専門的で信頼感のある外見で、表情・ジェスチャーも再現している。
- 音声:AIだけで生成。テキスト・トゥ・スピーチ(TTS)技術を用いて、ニュースのテキストを自然な声に変換している。
- ニュース内容:アルゴリズムを使用して、各視聴者の好みに合わせたニュースを配信している。
Channel1 AIのニュース配信は、公式サイト以外にX(Twitter)でも視聴できます。
興味のある方は、早速見てみましょう!
なお、Channel1 AIについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Channel 1 AI】AIだけで運営される次世代のニュース番組が登場!AIが人間を代替するか、リスクを考察してみた
【Phi-2】25倍サイズに匹敵する性能を持つ小型AIモデル
「Phi-2」は、Microsoft社が開発したパラメーター数2.7Bの小型言語モデル(SLM)です。
Phi-2のサイズがいかに小型であるか、他のAIモデルと比較した下表をご覧ください。
Phi-2 | GPT-3.5 | GPT-4 | Llama-2 | |
---|---|---|---|---|
パラメーター数 | 2.7B | 175B | 1.5T(推定) | 7B/13B/70B |
ご覧のとおり、GPTやLlama-2と比べるとPhi-2のサイズは圧倒的に小さいですよね。
さらにPhi-2がすごいのは、ただサイズが小さいだけではありません。性能も非常に高いのです!
以下は、Phi-2とLlama-2・Mistralの性能を比較した結果です。
ご覧のとおり、Phi-2はパラメーター数が約25倍のLlama-2-70Bとほぼ同等の性能を持っていることがわかります。
プログラミングの能力にいたっては、Llama-2-70Bをはるかに上回っていますね。
これだけ小型で性能が高ければ、近い将来Phi-2はスマホなどのモバイルデバイスに搭載され、誰でも手軽に操作できるようになるかもしれません。
Phi-2はAzure AI Studioにて無料で利用できる(商用利用は不可)ので、興味のある方はぜひ試してみてください!
なお、Phi-2についてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Phi-2】パラメーター数が25倍のLlama-2-70Bと同等の性能を持つ、Microsoftの最強小型LLM
【Mixtral-8x7B】Llama-2-70BやGPT-3.5に匹敵する高性能AIモデル
「Mixtral-8x7B」は、Mistral AI社が開発したAIモデルです。
Mixtral-8x7Bの大きな特徴として、SMoEと呼ばれる技術を利用している点が挙げられます。
特定のタスクに特化した「専門家」のように機能するプログラムを複数組み込む技術。
それぞれの専門家は特定のタスクに最適化されているため、入力されたデータに応じて最も適切な専門家が選択され、複雑なタスクも効率的かつ正確に処理できる。
このSMoEのおかげで、Mixtral-8x7Bは46.7Bパラメーターというサイズながら、Llama-2-70BやGPT-3.5(175B)と同等以上の性能を持つのです。(下表参照)
Mixtral-8x7Bはオープンソース化されたモデルのため、誰でも無料で利用できます。(ただし、それなりのスペックのPCが必要)
興味のある方は、ぜひMixtral-8x7Bを触ってみてください!
なお、Mixtral-8x7Bについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Mixtral-8x7B】GPT3.5とLlama2 70Bを上回る性能の無料オープンソースを使ってみた
【Leonardo.Ai】テキストやスケッチから超高品質画像を生成
「Leonardo.Ai」は、高品質な画像を簡単に生成できるAIツールです。
Leonardo.Aiの主な機能は、以下の3つ。
- Image Generation:テキストから画像を生成する機能
- Realtime Canvas:スケッチをリアルタイムで画像に変換する機能
- Canvas Editor:画像を編集できる機能
試しに「Image Generation」機能で、以下のプロンプトを入力してみると…
A portrait of a woman on a beach during a summer day. She is relaxing in the warm sunshine, wearing a casual T-shirt and shorts. The background features a blue sky and calm sea, with a sailboat visible in the distance. Her hair is blowing in the breeze, and she is smiling towards the camera. The sandy beach is scattered with colorful shells and pebbles, and her sunglasses and sunscreen are placed nearby.
以下のような画像が生成されました。AIで作ったとは思えないクオリティですよね!
また、「Realtime Canvas」を使えば、簡単なスケッチを高品質画像にリアルタイムで変換できます。
以下の動画は、魚のスケッチを変換した様子です。
残念ながら魚とは認識してもらえなかったものの、本当にリアルタイムで画像に変換できていますよね!
Leonardo.Aiには無料プランもあるため、興味のある方はぜひ一度使ってみてください!
なお、Leonardo.Aiについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Leonardo.AI】プロンプトも画力も無用!誰でも最優秀賞の絵を一瞬で描ける画伯AI
【GAIA】AIモデルの性能を測る新しいベンチマーク
「GAIA」は、AIモデルの性能を測定するベンチマーク(評価指標)の1種です。
人間にとっては簡単なタスクを、AIがどれだけ正確にこなせるかを測るもので、難易度が3段階に分かれた計466問の問題で構成されています。
以下は、GAIAで出題される問題の例です。
レベル1
もし、エリウド・キプチョゲがマラソンの記録更新ペースを無限に維持できたとしたら、地球と月が最も接近する距離を走るのに何千時間かかるでしょうか?計算の際には、ウィキペディアの月のページにある近地点の最小値を使用してください。計算結果は1000時間単位で四捨五入し、カンマ区切りは使わないでください。
回答:17
レベル3
1959年7月2日、脱水と記載された加工果物、野菜、その他特定の製品の等級に関する米国規格では、「乾燥・脱水セクション」に特に脱水と記載された品目と、「冷凍・冷蔵セクション」に品目名全体が記載された品目を考慮するが、「冷蔵」と記載されている場合は考慮しない。2023年8月現在、1959年の規格に記載された日付以降に新版に置き換えられた規格の割合は(パーセント単位で)何パーセントですか?
回答:86
この程度の問題であれば、我々でもネットで調べれば簡単に解けますよね?
ところが、実際に主要なAIモデルのGAIA値を測定してみると、人間は正答率が92%なのに対し、AIはプラグインを搭載したGPT-4ですら正答率がたったの15%だったそうです。
今後AIの性能をアピールする上で、GAIA値がいかに高いかが重要になりそうですね。
GAIAはHugging Faceでも公開されているため、興味がある方はChatGPTなどに問題を解かせてみてはいかがでしょうか?
なお、GAIAについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【GAIA】LLM専用のIQテストでGemini、ChatGPT、Claude 2の性能を比較してみた
【LucidDreamer】テキスト・平面画像から3Dシーンを生成
「LucidDreamer」は、テキストや平面画像から3Dシーン(場面や環境)が生成できるAIツールです。
LucidDreamerは、ざっくり以下のステップで3Dシーンを生成します。
- 一貫性のある画像の生成:テキストや画像の情報を基に、多数の小さな点(点群)を使って、目指すシーンの大まかな形や配置を決める。
- 新しい点の組み込み:既に作成された画像の基本構造に新たな点を追加して、より自然でリアルな3Dシーンを作り上げる。
- ガウシアンスプラッティングによる最適化:「ガウシアンスプラッティング」という技術を用いて、従来よりもはるかにリアルで精細な3Dシーンに仕上げる。
LucidDreamerの使い方は簡単で、3D化したい画像をアップロードし、プロンプトをテキストで入力するだけ。
以下は、実際にLucidDreamerで作成した3Dシーンです。
若干の不自然さはあるものの、しっかりと奥行きが再現できていますよね!
LucidDreamerはオープンソース化されているため、誰でも無料で利用できます。(ただし、それなりのスペックのPCが必要)
興味のある方は、ぜひLucidDreamerを試してみてください!
なお、LucidDreamerについてより詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【LucidDreamer】2Dの画像から簡単に3D画像を作れる画像生成AIを使ってみた
まとめ
以下、今回紹介したAIツール・サービスのまとめです。
AIツール・サービス名 | 概要 | 利用条件 |
---|---|---|
Suno | ・歌詞を入力するだけでオリジナル曲を自動で生成できるAIツール ・使い方は、歌詞と曲調を入力するだけ ・生成された音楽は自由にカスタマイズできる | 無料プランあり |
Gemini Pro API | 企業や開発者がGemini ProをAPI経由で独自に活用できる | 1分あたり最大60クエリまで無料で利用可能 ※無料期間は2024年初頭まで |
Channel 1 AI | ・AIだけで制作されたニュース配信 ・キャスター・音声・ニュース内容すべてにAIの機能を活用している | X(Twitter)で視聴可能 |
Phi-2 | ・パラメーター数2.7Bの小型AIモデル ・パラメーター数が約25倍のLlama-2-70Bとほぼ同等の性能を持つ ・プログラミングの能力はLlama-2-70Bを上回る | Azure AI Studioにて無料で利用可能 ※商用利用不可 |
Mixtral-8x7B | ・Mistral AI社が開発したAIモデル ・SMoE技術を利用しており、複雑なタスクを効率的にこなせる ・Llama-2-70BやGPT-3.5と同等以上の性能を持つ | 無料で利用可能 |
Leonardo.Ai | テキストから画像を生成する機能(Image Generation)や、スケッチをリアルタイムで画像に変換する機能(Realtime Canvas)がある | 無料プランあり |
GAIA | ・人間にとっては簡単なタスクを、AIがどれだけ正確にこなせるかを測るベンチマーク ・難易度が3段階に分かれた計466問の問題で構成されている ・人間の正答率が92%なのに対し、AIはプラグインを搭載したGPT-4ですら正答率がたったの15%だった | Hugging Faceにて無料で公開 |
LucidDreamer | ・テキストや平面画像から3Dシーン(場面や環境)が生成できるAIツール ・使い方は、3D化したい画像をアップロードし、プロンプトをテキストで入力するだけ | 無料で利用可能 |
今回紹介したツール・サービスの中でもし気になるものがあれば、ぜひお手元のPCで一度動かしてみてください!
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。