記事のサマリー(TL;DR)
- AWSが次世代 OpenSearch Serverless を発表。コンピートとストレージを分離し、アイドル時はコスト $0 にスケールダウン
- Cloudflare の調査では、全 HTTP トラフィックの 31% がボット由来、2027年前半には非人間トラフィックが人間を超えると予測
- Databricks・Snowflake・Microsoft Azure・Cloudflare も AIエージェント対応インフラへ相次いで転換中
国内 AIエージェント活用企業・クラウド基盤担当者が押さえておくべき変化
人間が検索・クリック・スクロールすることを前提に設計された従来のクラウドインフラは、AIエージェントのトラフィックパターンに追いつけていません。エージェントはサブエージェントを大量に起動し、数秒でAPI・データベース・ドキュメントを横断検索した後、即座に停止します。この「予告なきスパイク」と「予告なき停止」は、常時一定のリソースを確保することを前提にしてきた従来型のインフラ設計と根本的に相性が悪いのです。
国内でも、kintone や Salesforce と接続した社内エージェントを構築する動きが本格化しています。こうした構成では、エージェントが呼び出すベクトルDB・検索APIのコスト構造が事業採算を左右します。今回の AWS OpenSearch Serverless のように「使った分だけ」の課金モデルが整備されることで、エージェント活用の経済的ハードルが下がります。また、VercelやKiroとのネイティブ統合により、インフラ管理なしで本番品質のベクトル検索バックエンドをデプロイできるようになる点は、開発リソースが限られる国内スタートアップや中小企業にとっても選択肢の広がりを意味します。
詳細
クラウドインフラは「人間」を想定して作られてきた
長らく、クラウドインフラは人間が検索し、クリックし、スクロールし、動画をストリーミングするという一定の予測可能なパターンを前提に設計されてきました。AIエージェントはこれとは根本的に異なる挙動を示します。エージェントは複数のサブエージェントを一斉に立ち上げ、数百のデータベースを照会し、大量のAPIを呼び出し、そして来た時と同様の速さで消えます。
こうした現実を受け、Amazon は自社クラウドインフラの中核を担う部分を再設計しました。AWS は木曜日(現地時間)、次世代 OpenSearch Serverless を発表しました。これは完全マネージド型の検索・ベクトルデータベースであり、AIエージェントのワークロードに特化して設計されています。
OpenSearch Serverless の技術的変更点
最大の変更点は、**コンピートとストレージの分離(デカップリング)**です。これにより、エージェントがトラフィックスパイクを起こした際には数秒でコンピートをスケールアップし、アイドル状態ではゼロまでスケールダウン、つまりコストを $0 にすることができます。
Amazon OpenSearch Service のゼネラルマネージャーである Tia White 氏は TechCrunch に対してこう述べています。「タイミングは明快です。エージェントは実験段階から本番稼働へと移行しつつあり、従来のインフラが想定していなかったトラフィックパターンを生み出しています。エージェントは予告なくスパイクし、予告なくアイドルに戻ります。企業はアイドルなコンピートに対して費用を払い続けることなく、ついてこれる検索インフラを必要としています。」
旧バージョンのサーバーレスでも、ストレージとコンピートが結合していたため、最低1インスタンスは常時稼働させる必要がありました。White 氏はその状況を「使っていなくても駐車場代を払い続けるようなもの」と表現しています。新しい仕組みはいわば「コインパーキング」、すなわち使った時間分だけ支払う構造です。
ローンチ時点では、Vercel および Kiro などのAI開発プラットフォームとネイティブ統合される予定であり、開発者はインフラを管理することなく、本番利用可能な検索・ベクトルバックエンドをエージェント向けにデプロイできます。
非人間トラフィックが人間を超える日
この動きは AWS だけにとどまりません。Cloudflare によると、過去6カ月の全 HTTP トラフィックのうち 31% がボット由来であり、そのうちのおよそ4分の1はAIクローラー・検索エンジン・AIアシスタントによるものです。
Cloudflare のシニアプロダクトマネージャーである Lai Yi Ohlsen 氏は TechCrunch に対し、「2027年前半のどこかで、非人間トラフィックが人間トラフィックを超えるでしょう」と語りました。
Google I/O(先週開催)では、ユーザーが購入調査・旅行予約・ウェブブラウジング・アプリ操作などをAIシステムに委任できるようになると発表されました。これは消費者向けエージェントに限りません。企業も社内向け・顧客向けにエージェントを積極的に展開しており、舞台裏では新たなマシン間トラフィックが生まれています。
業界全体で進む「エージェントファースト」なインフラ再設計
クラウド・インフラ各社の動向をまとめると以下の通りです。
- Databricks・Snowflake:企業データのためのAIメモリ・検索システムとして自社をリポジショニング
- Microsoft Azure:AIエージェントのバーストトラフィックへの対応とエージェント間メモリ共有の機能を順次提供
- Cloudflare:先月、エージェントに永続的な実行環境と即時スケーラビリティを与えるインフラを発表
企業がAIエージェントをより多く展開するほど、インフラのマシン対応化への圧力が高まります。そしてインフラが整備されるほど、エージェントのデプロイコストが下がり、さらに大規模な活用が加速するという正のフィードバックが働きます。今まさに、インターネットのアーキテクチャは「人間のためのウェブ」から「マシンのためのウェブ」へと静かに、しかし確実に再構築されています。