ChatGPTエージェントモードが発表されてからはや一週間。
ChatGPT Plusユーザーの私としては今か今かと実装を待ち続けていたのですがついにPlus版にも搭載!ということで早速使ってみました。
ChatGPTエージェントモードとは?
ChatGPTのエージェントモードは、従来の対話形式のAIアシスタントの機能を超え、ユーザーの代わりに自律的にタスクを実行する能力を持つ、より高度な動作モードを指します。単に質問に答えるだけでなく、与えられた目標を達成するために、複数のステップからなる複雑な作業を自動で計画し、実行することができる、という優れものです。
あまり細かく指示をしなくても自律的に色々やってくれるわけですね。
一応Geminiさんにインフォグラフィックにまとめてもらったので見てみましょう。

それで、この手の機能が出ると必ず話題に挙がるのが「レストランの予約を自動でやってくれますよ」的な話なのですが、その辺は個人的にあまり興味なく…どう使おうかなと思っていた中で気になったのがスライド作成機能でした。
スライド作ってみよう
まあ、まずはやってみましょう、ということでとりあえず、まず試してみたのは昨日かけていたある会社のHPと競合他社のHP比較のDeepResearchの結果をもとにした、HP改善提案のスライド作成でした。
とりあえず時系列を追ってお話ししますと、まずは仮想環境が立ち上がります。
その中で検索したり、コーディングしたりと処理が始まるわけです。

これを見ていると、前身のOperatorを思い出します。あれも最初見たときは「自動で動いてる!」と感動したんですよね。
あと、仮想環境のマウスポインタのところに「今何をしているか」の表示が出るのも面白いです。
とはいえ、さすがに特定企業を想定しているものはブログネタでは提供できないので、「ChatGPTのSearch機能とDeepResearchで競合企業を調査してみよう的な研修資料を作ってください」、という形で指示だししてできたのがこちら。
※Google Slideだといくつかの画像がうまく表示されないようです。PowerPointだと表示されますが…
ほかにも何本か回しては見たのですが、感想としては
「内容は別段悪くはないが、なんかデザインも中身もうっすい」
というところでした。気になっていろいろと調べてみたところ、現時点ではスライド機能はベータ版のようです。OpenAIのページを見てみると下記のようなことが書かれていました。
「スライドショー生成機能には大きな可能性があると考えていますが、現在この機能はベータ版です。現時点では、特に既存のドキュメントがない状態から開始した場合、出力内容の書式や仕上がりがやや粗く感じられることがあります。」
出典:https://openai.com/ja-JP/index/introducing-chatgpt-agent/
ちなみに下記の資料は一度o3に構成を作らせてからスタートしているのでそこそこの資料になっているのかな、とも思うところです。いずれにせよ、資料作成の下地としてはそこそこ良いものができるなぁと思いますし、下地があるだけでも十分効率化にはなりますから、まぁいいかな、とも思ったり。逆にすごい近未来的なデザインで作られるほかのスライド生成AIよりも加工しやすい分良いかな、と思ったりもします。
何分、生成AI重課金の身ではこれ以上スライド生成用のAIへの追い課金も厳しく、手持ちAIの中で神威を使ってみたり、CursorでMarpで生成してみたり色々試してはいた身です。これくらいのものができるだけでも今までより手軽にスライド生成できるのですごく嬉しいところです(Marp形式でのスライド生成も、もう少しうまく使いこなせると面白い気はしているのですが…)。
なお、もう一個課題を挙げるとすればスライド生成に時間がかかります。20枚のスライドで20~30分、50枚のスライドで1時間、というところでした。Gamma等のスライド生成AIにはまだまだ負けますね。
しかし、これが「いつものChatGPT」でできることに十分価値はある。これからに向けて可能性は十分に感じた検証でした。
オマケ
エージェントモード早回し版です。早回し版を見るとManusちっくになりますね。