先日、怒りに満ちたメールが届きました。
Aさんからの「2日間も無駄にした!」という内容でした。Aさんは、クライアント向けの特典として「5分間でわかる〇〇」という動画コンテンツを作ろうとしていました。
ChatGPTの無料版を使い、動画コンテンツをアイデアを30個ほど生成しました。その後、アイデアをもとに「AIによるナレーション付きの5分の動画」を作るように、依頼したそうです。
この後、Aさんは、ChatGPTと「格闘」することになりました。
ChatGPTは、やり取りの中で「Googleドライブでファイルをシェアします」「ドロップボックスのリンクで納品します」「ギガファイル便で送ります」などと答えたものの、実際にはリンク切れや空のファイルばかりだったそうです。
おそらく、Aさんが「完成品をGoogleドライブに保存してください」と頼んだのかも知れません。そして、ChatGPTは「はい、わかりました!」などと、返事をしたので、期待して待っていたのかも知れません。
GoogleドライブがダメならDropbox、ギガファイル便・・・と、いろんな依頼を繰り返し、2日間も振り回された挙句、結局何も手に入らなかったとのことでした。
このメールを読んだとき、「AIがなんでもできる!」という世間のイメージと現実のギャップを強く感じました。テレビCMやニュースで「AIがすごい!」と連日報道される中で、私たちは知らず知らずのうちに、AIの能力を過大評価していることが多いのです。
今日は、このメールをきっかけに、生成AIの本当の限界と可能性について、改めて考えてみたいと思います。
生成AIの正体とは?
まず、ChatGPTやClaudeといった生成AI(LLM:Large Language Model)が何をしているのかを理解することが重要です。
彼らは本質的に「次の言葉を予測して、テキストを生成する」ことしかできません。私は、これを理解しやすいように「入力された文章に対して、高度なレベルによる続きを書いている」と表現しています。つまり、入力されたことの続きを書くのが彼らの本質です。
その結果、テキストベースのコンテンツ(シナリオやスクリプト)を作成したり、アイデアを提案したり、既存のテキストを編集したりすることはできますが、それ以上のことはできません。
テキストベースのコンテンツを作る以上のことをさせたければ、「他の道具」と組み合わせる必要があります。
例えば、私がChatGPTに「明日の天気はどうですか?」と聞くと、ChatGPTが、「明日は晴れるでしょう」と返答をしたとします。AIの仕組みを知らず、過大評価したら、「気象庁のデータを見て、明日の天気を考えたんだ!すごい!」と思うかも知れません。
実際は、実際の気象データに基づいているわけではなく、私の質問に対する「もっともらしい返答」を生成しているだけなのです。
気象庁のデータや、その他の天気予報データを入手して総合判断させたければ、LLMに「情報検索機能」を掛け合わせる必要があります。
依頼内容をLLMが理解する
どんな情報を検索するべきか考える
情報を検索し、データを入手する
データと自身(LLM)の知識を使って、回答を考える
ということを「プログラム」してあげないと、正確な天気予報を返すことはできないということです。
最近のAIは、「検索すること」もできるようになったので、もしかしたら「もっとたくさんのことができる!」と期待してしまったのかも知れません。
ところで、なぜ「できないこと」をできると言うのか
Aさんの事例で特に興味深いのは、ChatGPTが「GoogleドライブやDropboxでファイルを共有します」と言ったにもかかわらず、実際には何もできなかったという点です。
これは生成AIの世界では「ハルシネーション(幻覚)」と呼ばれる現象です。
AIが自分の限界を理解せず、あたかも「できないことが、できるかのように振る舞って」しまうのです。特にChatGPTは、「幻覚」が多い印象があります。無料版ChatGPTを使うと、性能が低いので、より「幻覚」を引き起こしやすい可能性があります。
余談ですが、私の印象では、Claudeは、このハルシネーションがChatGPTに比べると、かなり少ないです。
ちなみに、私は、ChatGPTのDeep Researchが時々あらぬ方向に推論してしまうことがあるため、検索AIとしては信頼していません。
生成AIにできること・できないこと
では、具体的に整理してみましょう。
生成AIができること:
テキストベースのコンテンツ(シナリオ、スクリプト)の作成
アイデアの提案やコンセプトの整理
既存コンテンツの編集や改善提案
生成AIができないこと:
実際の音声ファイルの作成(別のツールとの連動が必要)
実際の動画ファイルの制作(同上)
作成したファイルのアップロードやリンク生成(インターネット上でのファイル操作)
生成AIを効果的に活用するには
では、Aさんのようなプロジェクトを実現するにはどうすればよいのでしょうか?
実現したい作業のワークフローを明確にする
生成AIを使うべき部分と他のツールを使うべき部分を区別する
生成AIと複数のツールを組み合わせる処理を実現する
例えば、「5分間でわかるマインドフルネス瞑想」の動画解説を作りたい場合、生成AIにはスクリプトの作成を依頼し、そのスクリプトを基に別の音声合成ツールで音声ファイルを作成し、さらに別の動画編集AIで視覚素材と組み合わせるといった流れになります。
これらの処理を自動化したい場合は、Pythonなどのプログラミング言語を使用して、AIと各種ツールを連動させるプログラムを書く必要があります。または、DifyのようなAIと複数のツールを連携させるアプリケーションを使用する方法もあります。
まとめ:AIとの付き合い方
生成AIは非常に強力なツールですが、魔法の杖ではありません。その限界を理解し、適切な期待を持って接することが重要です。
Aさんの事例は、生成AIの限界を理解することの重要性を教えてくれます。期待と現実のギャップに失望するのではなく、AIの特性を理解した上で、他のツールと組み合わせて活用する方法を探ることが、より生産的なアプローチではないでしょうか。
皆さんも、生成AIに何かを依頼する際は、「これは本当にAIだけでできることか?」と一度立ち止まって考えてみてください。それだけで、多くの時間と労力を節約できるはずです。
今日も、皆さんの学びと発見が豊かでありますように!