202510評: この業界は本当に変化が速くて、ついていけないほどです
報道は、コストが急騰し、商業価値が不明瞭でリスク管理が不十分なため、Gartnerの予測によると、2027年末までに代理式人工知能(agentic AI、新興企業の名称)のプロジェクトの40%以上が中止されるだろうと指摘している。残る60%のプロジェクトについても、タスク成功率は30〜35%にとどまる。代理式AIとは、機械学習モジュールを介してさまざまなアプリケーションとAPIを接続し、メールの過大な記述内容を検索・分析するなどオフィス業務を自動化する技術である。記事は、この概念は『スター・トレック:ネクストジェネレーション』でキャプテン・ピカードが「ティア、アールグレイ、ホット」と言ったコマンドのように、SF作品で未来を想像させるものだったが、現実では技術が理想の効率に達しておらず、セキュリティとプライバシーのリスクがあると指摘している。
代理式AIの実際の性能を検証するために、カーネギーメロン大学(CMU)の研究者たちは、小型ソフトウェア企業を模擬したテストプラットフォームTheAgentCompanyを構築し、AIエージェントがウェブブラウジング、プログラミング、アプリケーションの操作、内部コミュニケーションなどのタスクをどれだけうまくこなせるかを評価した。テスト結果では、最適なモデルであるGemini-2.5-Proも約30.3%の完全なタスク成功率にとどまり、他のモデルはさらに不十分な結果を示し、インターフェースのポップアップやメッセージ送信の誤りなどの欠点が明らかになった。また、Salesforceチームが設計した顧客関係管理(CRM、Customer Relationship Management)用のCRMArena-Proテストプラットフォームでは、最も優れた長期言語モデル(LLM)エージェントでも、単一の会話では成功率が58%、複数の会話では約35%にとどまり、各モデルは機密データ保護能力が欠如しており、企業のセキュリティリスクをさらに高めていると指摘している。
さらに、報道は市場で多くの代理知能を宣伝する新製品が、実際には伝統的なAIアシスタント、機械的プロセス自動化(RPA)やチャットボットを再包装したものであることが多いと明らかにしている。真の代理能力を持つ製品は供給業者の多くの中から極めて少数に過ぎない。今後、Gartnerは2028年までに毎日の業務決定の15%がAIエージェントによって自動化され、企業ソフトウェア製品の33%にこの技術が搭載される見込みだが、現状の成果は複雑な業務ニーズを満たせておらず、特にメール処理などでは誤りが重大な結果を招く可能性がある。
議論では、開発者や業界関係者から代理式AIの将来について異なる見解が示されている。ある評論では、現在の進展がプラットフォームの飽和あるいは「人機協作」(human in the loop)時代への移行を示していると指摘し、代理式AIは既存の自動化ツールと本質的に違いがないと主張している。一方で、別の意見では、関数ライブラリ(library)ではなくフレームワーク(framework)の観点から代理技術を構築することで、柔軟性と組み合わせ可能性を保ちつつ、実行結果の予測可能性を確保できると主張している。一部の評論では、代理式AIが一部の用途では効率を多少改善するものの、速度、コンテキストウィンドウの長さ、コスト面での重大な技術革新がなければ、オフィス自動化の実際のニーズを満たすことはできないと指摘している。
https://news.ycombinator.com/item?id=44412349