Chúng tôi đã bỏ qua bài blog cho bản 3.11. Không phải vì chẳng có gì xảy ra — 3.11 có rất nhiều thứ mới — mà vì 3.12 ra mắt bốn ngày sau đó và viết gộp hai bản có lý hơn. Hai phiên bản, một bài viết.
Đây là tất cả những gì quan trọng.
Control UI: Dashboard v2
Control UI đã được viết lại từ đầu. Không phải thay da — mà là nghĩ lại hoàn toàn.
Dashboard cũ là một trang duy nhất cố làm mọi thứ. Bản mới chia thành các view chuyên biệt: Overview, Chat, Config, Agent và Sessions. Mỗi view làm tốt một việc. Có command palette (Cmd+K) cho người dùng nâng cao, tab dưới cùng cho truy cập di động, và view chat giờ hỗ trợ slash command, tìm kiếm tin nhắn, xuất dữ liệu và ghim tin nhắn.
Đây là công sức của @BunsDev trong PR #41503, và là kiểu đóng góp thay đổi cách mọi người tương tác với OpenClaw hằng ngày. Nếu bạn quản lý instance qua trình duyệt, trải nghiệm giờ hoàn toàn khác.
Fast Mode: GPT-5.4 và Claude, một nút duy nhất
Fast mode từng là khái niệm mơ hồ — một số model có, nút bật tắt không nhất quán, và hành vi khác nhau giữa các giao diện.
3.12 thống nhất tất cả. Giờ có một toggle /fast duy nhất hoạt động trên TUI, Control UI và ACP. Với OpenAI, nó cấu hình request cho fast tier của GPT-5.4. Với Anthropic, nó ánh xạ trực tiếp sang tham số service_tier của API. Cả hai được kiểm tra real-time — nếu tài khoản của bạn không có quyền truy cập fast tier, hệ thống sẽ thông báo thay vì âm thầm giảm chất lượng.
Cấu hình mặc định theo model nghĩa là bạn có thể đặt fast mode làm mặc định cho những model cụ thể trong khi giữ chế độ tiêu chuẩn cho các model khác. Ghi đè cấp session cho phép chuyển đổi giữa cuộc trò chuyện.
Một toggle, hai nhà cung cấp, hành vi nhất quán mọi nơi. Thế thôi.
Ollama: công dân hạng nhất (3.11)
Ollama đã chuyển từ "được hỗ trợ" sang "hạng nhất" trong 3.11.
Trình hướng dẫn cấu hình giờ có đường dẫn chuyên biệt cho Ollama với hai chế độ: Local (mọi thứ chạy trên máy bạn) và Cloud + Local (model cloud cho tác vụ nặng, local cho tác vụ nhạy cảm về quyền riêng tư). Có đăng nhập cloud qua trình duyệt, gợi ý model được tuyển chọn dựa trên phần cứng, và xử lý thông minh bỏ qua tải xuống local không cần thiết khi bạn dùng model cloud.
Điều này quan trọng vì model local là câu trả lời cho quyền riêng tư. Không API key, không dữ liệu rời máy bạn, không hóa đơn hằng tháng. Với người dùng muốn điều này, đường dẫn cấu hình giờ mượt mà như đường dẫn của nhà cung cấp cloud. Cảm ơn @BruceMacD.
Riêng biệt, Ollama, vLLM và SGLang đều đã chuyển sang kiến trúc provider-plugin trong 3.12. Onboarding do provider quản lý, khám phá model, thiết lập picker và hook hậu chọn giờ là modular. Nếu bạn đang xây dựng tích hợp provider tùy chỉnh, đây là pattern cần theo.
Bộ nhớ đa phương thức: hình ảnh và âm thanh (3.11)
Hệ thống bộ nhớ của OpenClaw đã học cách nhìn và nghe.
3.11 thêm lập chỉ mục đa phương thức opt-in cho memorySearch.extraPaths. Trỏ đến thư mục chứa hình ảnh hoặc file âm thanh, và tìm kiếm bộ nhớ giờ có thể đưa các file đó lên trong ngữ cảnh. Bên dưới, nó dùng model gemini-embedding-2-preview của Gemini với chiều đầu ra có thể cấu hình và tự động lập chỉ mục lại khi chiều thay đổi.
Tính năng này nằm sau opt-in rõ ràng — không lập chỉ mục bất ngờ thư viện ảnh của bạn. Nhưng với người dùng muốn agent nhớ ngữ cảnh hình ảnh (ảnh chụp màn hình, sơ đồ, biên lai), đây là bổ sung năng lực đáng kể. Cảm ơn @gumadeiras.
iOS và macOS: native ngày càng tốt hơn (3.11)
Hai cải tiến đáng kể cho nền tảng native trong 3.11:
iOS Home Canvas (@ngutman): App iOS có màn hình chào mừng tích hợp với tổng quan agent trực tiếp cập nhật khi kết nối, kết nối lại và quay về foreground. Các điều khiển nổi được thay bằng toolbar cố định, bố cục thích ứng với điện thoại nhỏ hơn, và chat giờ mở trong session chính đã phân giải thay vì session iOS tổng hợp. Ngoài ra: luồng beta release trên TestFlight với hỗ trợ Fastlane.
macOS Chat UI (@ImLukeF): Composer chat macOS giờ có bộ chọn model, giữ lại lựa chọn thinking level giữa các lần khởi động lại và đồng bộ đúng model session giữa các provider.
Đây không phải tính năng nổi bật, nhưng chúng cộng dồn. Mỗi lần trải nghiệm native mượt hơn một chút, khoảng cách giữa "tôi dùng OpenClaw qua Telegram" và "tôi dùng OpenClaw native" lại thu hẹp.
Kubernetes: điểm khởi đầu
3.12 thêm đường dẫn cài đặt Kubernetes khởi đầu: manifest thô, thiết lập Kind cho test local và tài liệu deployment. Cảm ơn @sallyom, @dzianisv và @egkristi.
Đây không phải Helm chart đã qua thử nghiệm production — mà là điểm khởi đầu cho các đội muốn chạy OpenClaw trên K8s. Hãy chờ đợi nó phát triển nhanh dựa trên phản hồi cộng đồng.
Subagents: sessions_yield
Một primitive nhỏ nhưng quan trọng cho điều phối: sessions_yield cho phép agent điều phối kết thúc lượt hiện tại ngay lập tức, bỏ qua mọi công việc tool đang chờ và mang theo payload theo dõi ẩn sang lượt session tiếp theo.
Tại sao điều này quan trọng: trong workflow đa agent, đôi khi bộ điều phối cần thoát sớm khỏi một lượt — có thể một tác vụ ưu tiên cao hơn đã đến, có thể chuỗi tool hiện tại đang đi sai hướng. Trước đây phải đợi tất cả công việc trong hàng đợi hoàn thành. Giờ bạn có thể cắt hàng. Cảm ơn @jriff (#36537).
Bảo mật: 8 advisory
Đây là phần bạn thực sự nên đọc kỹ nếu đang chạy OpenClaw trong production. Giữa 3.11 và 3.12, có 8 GitHub Security Advisory:
Nghiêm trọng: Xác thực origin WebSocket (3.11) **GHSA-5wcw-8jjv-m286** — Xác thực origin trình duyệt bị bỏ qua khi header proxy không có. Trong chế độ trusted-proxy, điều này mở đường cho cross-site WebSocket hijacking có thể cấp quyền `operator.admin` cho các origin không đáng tin. Đã sửa: xác thực origin giờ chạy trên tất cả kết nối trình duyệt bất kể header proxy.
Các bản sửa bảo mật 3.12
| Advisory | Gì | Tác động |
|---|---|---|
| GHSA-99qw-6mr3-36qr | Plugin workspace tự động tải mà không có tin cậy | Repo được clone có thể âm thầm thực thi mã plugin |
| GHSA-pcqg-f7rg-xfvv | Unicode vô hình trong prompt phê duyệt exec | Ký tự zero-width có thể giả mạo lệnh đã kiểm tra |
| GHSA-9r3v-37xh-2cf6 | Bypass chuẩn hóa Unicode trong phát hiện exec | Ký tự fullwidth/vô hình né kiểm tra heuristic |
| GHSA-f8r2-vg7x-gh8m | Phân biệt hoa thường của allowlist exec trên POSIX | Pattern có thể khớp quá rộng giữa hoa thường/thư mục |
| GHSA-r7vr-gr74-94p8 | Truy cập không phải chủ sở hữu vào /config và /debug | Người không phải chủ sở hữu đã ủy quyền có thể truy cập bề mặt dành riêng cho chủ sở hữu |
| GHSA-rqpp-rjj8-7wv8 | Tự khai báo scope token chia sẻ | Token không có thiết bị có thể tự khai báo scope nâng cao |
| GHSA-vmhq-cqm9-6p7q | Lưu trữ profile trình duyệt qua browser.request | Caller có write-scope có thể lưu trữ profile trình duyệt dành riêng admin |
| GHSA-2rqg-gjgv-84jm | Ghi đè giới hạn workspace của agent | Caller bên ngoài có thể ghi đè giới hạn workspace của gateway |
Các bản sửa liên quan Unicode (GHSA-pcqg, GHSA-9r3v) đặc biệt đáng hiểu. Kẻ tấn công sử dụng ký tự Unicode zero-width và fullwidth để làm các lệnh độc hại trông vô hại trong prompt phê duyệt. Bản sửa chuẩn hóa Unicode và loại bỏ định dạng vô hình trước cả hiển thị lẫn phát hiện.
Bản sửa plugin workspace (GHSA-99qw) thay đổi hành vi mặc định: plugin trong repository được clone không còn tự động tải. Giờ bạn cần quyết định tin cậy rõ ràng. Đây là thay đổi breaking cho ai dựa vào việc tải plugin workspace ngầm — và điều này là cố ý.
Kết luận: cập nhật lên 3.12. Đây không phải lỗ hổng lý thuyết.
Phần còn lại
Có một danh sách dài các bản sửa trong cả hai phiên bản không thể nhét vào một bài blog, nhưng quan trọng với người dùng cụ thể:
- •Telegram: Lưu trữ bộ chọn model, chunking HTML, loại trùng giao preview — bốn bản sửa riêng biệt cho độ tin cậy tin nhắn
- •Kimi Coding: Khôi phục format Anthropic native cho tool call, sửa header User-Agent cho xác thực subscription, tương thích Ollama cho kimi-k2.5:cloud
- •Mattermost: Loại trùng block streaming, giao media trong reply với upload file local
- •BlueBubbles/iMessage: Loại trùng echo self-chat mà không chặn webhook rộng
- •Windows: Sửa đường dẫn cập nhật native — không còn crash vì thiếu git hoặc node-llama-cpp
- •Sandbox: Thao tác ghi không còn âm thầm tạo file rỗng
- •Discord (3.11): Thời lượng auto-archive cấu hình được cho thread
Những gì thay đổi (tổng hợp)
| Lĩnh vực | 3.11 | 3.12 |
|---|---|---|
| UI | iOS Home Canvas, bộ chọn model macOS | Control UI dashboard-v2, palette lệnh |
| Model | Onboarding Ollama hạng nhất, provider OpenCode Go | Fast mode GPT-5.4, fast mode Claude, kiến trúc provider-plugin |
| Bộ nhớ | Lập chỉ mục đa phương thức hình ảnh/âm thanh với Gemini embedding | — |
| Hạ tầng | — | Manifest Kubernetes, subagent sessions_yield |
| Bảo mật | Xác thực origin WebSocket (nghiêm trọng) | 7 advisory: plugin, Unicode, scope, workspace |
| Nền tảng | Lưu trữ thread Discord, sửa hình ảnh Feishu | Slack Block Kit, sửa Mattermost, cập nhật native Windows |
| Ổn định | Giao preview Telegram (4 bản sửa), cải thiện failover agent | Loại trùng cron, khám phá session, sửa ghi sandbox |
Hai phiên bản. Không có thứ thừa. Cập nhật ngay.