3.11のブログ記事はスキップした。何もなかったわけではない——3.11は内容が詰まっていた——ただ、4日後に3.12がリリースされたので、まとめて書いた方が筋が通る。2リリース、1記事。
重要な内容をすべてお届けする。
Control UI:Dashboard v2
Control UIが根本から書き直された。見た目の変更ではなく、設計思想の刷新だ。
旧ダッシュボードはすべてを1ページに詰め込もうとしていた。新しいものは専用ビューに分割されている:Overview、Chat、Config、Agent、Sessions。それぞれが1つのことをうまくやる。パワーユーザー向けのコマンドパレット(Cmd+K)、スマホ用のモバイルボトムタブ、そしてチャットビューはスラッシュコマンド、メッセージ検索、エクスポート、ピン留めメッセージに対応した。
これは@BunsDev がPR #41503で行った作業で、ユーザーがOpenClawと日々どう向き合うかを変える種類の貢献だ。ブラウザからインスタンスを管理しているなら、これはもう別の体験だ。
ファストモード:GPT-5.4とClaude、ひとつのトグルで
ファストモードはかつて曖昧な概念だった——一部のモデルが対応していて、トグルは一貫性がなく、インターフェースによって挙動がバラバラだった。
3.12で統一された。TUI、Control UI、ACPにまたがって機能する単一の/fastトグルが生まれた。OpenAI向けにはGPT-5.4のファストティア向けのリクエスト成形を行う。Anthropic向けにはAPIのservice_tierパラメータに直接マッピングされる。どちらもリアルタイムで検証される——アカウントがファストティアにアクセスできない場合、システムは黙って性能を落とすのではなく、その旨を通知する。
モデルごとの設定デフォルトにより、特定のモデルではファストモードをデフォルトにしつつ、他のモデルは標準モードに保つことができる。セッションレベルのオーバーライドで会話の途中で切り替えることも可能だ。
ひとつのトグル、2つのプロバイダー、どこでも一貫した挙動。それだけだ。
Ollama:ファーストクラスの市民権(3.11)
3.11でOllamaは「対応済み」から「ファーストクラス」へと昇格した。
オンボーディングウィザードにOllama専用のパスが追加され、2つのモード:Local(すべてがマシン上で動作)とCloud + Local(重い作業はクラウドモデル、プライバシーが必要なタスクはローカル)を選べる。ブラウザベースのクラウドサインイン、ハードウェアに基づいたモデル提案、クラウドモデル使用時に不要なローカルプルをスキップするスマートな処理が追加された。
これが重要なのは、ローカルモデルがプライバシーの答えだから。APIキー不要、データがマシンの外に出ない、月額費用もない。そういったユーザーには、セットアップ経路がクラウドプロバイダーと同じくらいスムーズになった。@BruceMacDに感謝。
一方で、3.12ではOllama、vLLM、SGLangがプロバイダープラグインアーキテクチャに移行した。プロバイダー独自のオンボーディング、モデルディスカバリー、ピッカー設定、選択後のフックがモジュール化された。カスタムプロバイダー連携を構築するなら、このパターンに倣うこと。
マルチモーダルメモリ:画像と音声(3.11)
OpenClawのメモリシステムが、見て聞けるようになった。
3.11ではmemorySearch.extraPathsのオプトイン型マルチモーダルインデックスが追加された。画像や音声ファイルのフォルダを指定すると、メモリ検索でそれらをコンテキストとして呼び出せるようになる。内部では、設定可能な出力次元と次元変更時の自動再インデックスを持つGeminiのGemini Embedding 2 Previewモデルを使用している。
これは明示的なオプトインに限定されており、フォトライブラリが突然インデックスされるようなことはない。ただし、エージェントに視覚的コンテキスト(スクリーンショット、図、レシートなど)を記憶させたいユーザーにとっては、意味のある機能追加だ。@gumadeirasに感謝。
iOSとmacOS:ネイティブ体験の向上(3.11)
3.11では2つの重要なネイティブプラットフォーム改善が加わった:
iOS ホームキャンバス(@ngutman):iOSアプリに、接続・再接続・フォアグラウンド復帰時にリフレッシュするライブエージェント概覧を備えたウェルカムスクリーンが追加された。フローティングコントロールはドック型ツールバーに置き換えられ、レイアウトは小型スマホに対応し、チャットは疑似的なiOSセッションではなく解決済みのメインセッションで開くようになった。また、Fastlaneサポートを含むTestFlightベータリリースフローも追加。
macOSチャットUI(@ImLukeF):macOSのチャットコンポーザーにモデルピッカーが追加され、再起動をまたいでシンキングレベルの選択が保持されるようになり、プロバイダーをまたいでセッションモデルが正しく同期されるようになった。
これらは目立つ機能ではないが、積み重なる。ネイティブ体験が少しずつ磨かれるたびに、「TelegramでOpenClawを使う」と「ネイティブでOpenClawを使う」のギャップが縮まっていく。
Kubernetes:出発点として
3.12ではKubernetesインストールの出発点が追加された:生のマニフェスト、ローカルテスト用のKindセットアップ、デプロイドキュメント。@sallyom、@dzianisv、@egkristiに感謝。
これはプロダクション対応のHelmチャートではなく、K8s上でOpenClawを動かしたいチームのための出発点だ。コミュニティからのフィードバックを基に急速に進化することが予想される。
サブエージェント:sessions_yield
オーケストレーションのための小さくも重要なプリミティブ:sessions_yieldを使うと、オーケストレーターエージェントが現在のターンを即座に終了し、キューに入っているツール作業をスキップし、次のセッションターンに非公開のフォローアップペイロードを引き継げる。
なぜ重要か:マルチエージェントのワークフローでは、オーケストレーターがターンを早期に切り上げる必要が生じる場合がある——優先度の高いタスクが割り込んできた、現在のツールチェーンが間違った方向に向かっているなど。これまでは、キューに入ったすべての作業の完了を待つ必要があった。今は途中でカットできる。@jriff(#36537)に感謝。
セキュリティ:8件のアドバイザリ
本番環境でOpenClawを運用しているなら、ここは特に注意して読むべきだ。3.11と3.12の間に、8件のGitHubセキュリティアドバイザリがある:
Critical:WebSocketオリジン検証(3.11) **GHSA-5wcw-8jjv-m286** — プロキシヘッダーが存在しない場合、ブラウザのオリジン検証がスキップされていた。信頼済みプロキシモードでは、クロスサイトWebSocketハイジャックの経路が開かれており、信頼されていないオリジンに`operator.admin`アクセスを与える可能性があった。修正:オリジン検証がプロキシヘッダーの有無にかかわらず、すべてのブラウザ接続で実行されるようになった。
3.12セキュリティ修正
| アドバイザリ | 内容 | 影響 |
|---|---|---|
| GHSA-99qw-6mr3-36qr | ワークスペースプラグインが信頼確認なしに自動ロード | クローンされたリポジトリがプラグインコードをサイレントに実行する可能性 |
| GHSA-pcqg-f7rg-xfvv | exec承認プロンプトへの不可視Unicodeの挿入 | ゼロ幅文字によりレビュー済みコマンドに見せかけられる可能性 |
| GHSA-9r3v-37xh-2cf6 | exec検出のUnicode正規化バイパス | 全角・不可視文字がヒューリスティックチェックを回避 |
| GHSA-f8r2-vg7x-gh8m | POSIX環境でのexec許可リストの大文字小文字感度 | パターンがケース・ディレクトリ境界をまたいで過剰マッチする可能性 |
| GHSA-r7vr-gr74-94p8 | /configおよび/debugへの非オーナーアクセス | 認可された非オーナーがオーナー専用画面に到達できる可能性 |
| GHSA-rqpp-rjj8-7wv8 | 共有トークンのスコープ自己申告 | デバイスなしトークンが昇格したスコープを自己申告できる可能性 |
| GHSA-vmhq-cqm9-6p7q | browser.requestによるブラウザプロファイルの永続化 | 書き込みスコープの呼び出し元が管理者専用ブラウザプロファイルを永続化できる可能性 |
| GHSA-2rqg-gjgv-84jm | エージェントワークスペース境界のオーバーライド | 外部呼び出し元がゲートウェイのワークスペース境界をオーバーライドできる可能性 |
Unicode関連の修正(GHSA-pcqg、GHSA-9r3v)は特に理解しておく価値がある。攻撃者はゼロ幅・全角Unicodeを使って、承認プロンプト上で悪意のあるコマンドを無害に見せかけていた。修正では、表示と検出の両方の前にUnicodeを正規化し、不可視フォーマットを除去するようになった。
ワークスペースプラグインの修正(GHSA-99qw)はデフォルト動作を変更する:クローンされたリポジトリ内のプラグインは自動ロードされなくなった。明示的な信頼の決定が必要になる。これは暗黙のワークスペースプラグインロードに依存していたユーザーには破壊的変更だ——そして、それは意図的なものだ。
結論:3.12へアップデートしてほしい。理論上の脆弱性ではない。
その他
両リリースにわたる修正の長い尾があり、ブログ記事には収まりきらないが、特定のユーザーには重要なものがある:
- •Telegram:モデルピッカーの永続化、HTMLチャンキング、プレビュー配信の重複除去——メッセージの信頼性に関する4件の個別修正
- •Kimi Coding:ツールコール向けネイティブAnthropicフォーマットの復元、サブスクリプション認証向けUser-Agentヘッダー修正、kimi-k2.5:cloud向けOllamaの互換性
- •Mattermost:ブロックストリーミングの重複除去、ローカルファイルアップロードを伴うリプライメディア配信
- •BlueBubbles/iMessage:広範なWebhook抑制なしでのセルフチャットエコーの重複除去
- •Windows:ネイティブアップデートパスの修正——gitやnode-llama-cppが見つからない場合のクラッシュがなくなった
- •サンドボックス:書き込み操作で空ファイルがサイレントに作成されなくなった
- •Discord(3.11):スレッドの設定可能な自動アーカイブ期間
変更サマリー(合算)
| エリア | 3.11 | 3.12 |
|---|---|---|
| UI | iOSホームキャンバス、macOSモデルピッカー | Control UIダッシュボードv2、コマンドパレット |
| モデル | Ollamaファーストクラスオンボーディング、OpenCode Goプロバイダー | GPT-5.4ファストモード、Claudeファストモード、プロバイダープラグインアーキテクチャ |
| メモリ | Gemini埋め込みによるマルチモーダル画像・音声インデックス | — |
| インフラ | — | Kubernetesマニフェスト、サブエージェントsessions_yield |
| セキュリティ | WebSocketオリジン検証(Critical) | 7件:プラグイン、Unicode、スコープ、ワークスペース |
| プラットフォーム | Discordスレッドアーカイブ、Feishu画像修正 | Slack Block Kit、Mattermost修正、Windowsネイティブアップデート |
| 安定性 | Telegramプレビュー配信(4件の修正)、エージェントフェイルオーバー改善 | cronの重複除去、セッションディスカバリー、サンドボックス書き込み修正 |
2リリース。無駄なし。今すぐアップデートを。