字節炸場!豆包手機助手來了:AI可直接控制手機

 人參與 | 時間:2025-12-04 00:04:25

字節跳動發布了全新一代豆包手機助手的字節炸場助手制手技術預覽版。不同于以往那些只能定鬧鐘、豆包查天氣的手機傳統語音助手,這款新產品被定義為真正意義上的可直手機第二大腦。它具備了視覺感知、接控機長期記憶以及直接動手操作的字節炸場助手制手能力,甚至能替用戶把整個手機的豆包功能玩明白。

豆包手機助手最引人注目的手機突破在于其真正的端側記憶能力。這是可直業界首次在手機本地實現了持久化的記憶功能。它能像一個細心的接控機私人管家一樣,記住用戶生活中的字節炸場助手制手瑣碎細節。

在實際演示中,豆包這種能力表現得令人印象深刻。手機當用戶詢問車停在哪里時,可直助手能直接調出用戶上次拍攝的接控機車位照片并附帶樓層指引。

當需要取快遞時,它能瞬間讀取短信歷史并報出取件碼;甚至當用戶詢問高鐵座位號時,它能自動翻找12306的購票記錄并告知準確位置。更進一步的是,這種記憶具有聯想能力,比如它記住了用戶最喜歡凡高,那么在規劃巴黎行程時,就會自動優先推薦奧賽博物館。

如果說記憶是基礎,那么跨App代操作則是豆包手機助手的殺手锏。它利用先進的GUI模擬點擊技術,能夠像真人一樣接管屏幕,跨越應用壁壘進行自動點擊、輸入和滑動。

在全網比價場景下,用戶只需發出一句指令,豆包就能打開淘寶、京東、拼多多和抖音電商,在3秒內給出最低價并直接停留在支付頁面。在更復雜的辦公場景中,它可以響應幫我請三天假,順便訂回老家高鐵的指令,自動打開辦公軟件填寫請假單、提交審批,隨后無縫跳轉至12306完成訂票和付款流程。

甚至連特斯拉車主都能體驗到這種便捷,一句打開前備箱放東西,助手即可直接遠程控制車輛執行操作。

在多模態交互方面,該助手展現了實時視覺理解能力。當用戶拿起一本英文繪本對準攝像頭時,豆包手機助手會立刻開啟實時視頻通話模式。

畫面中不僅會出現中英雙語字幕,AI還能用流利的普通話或英語邊講故事邊與用戶互動提問,甚至根據孩子的反應臨時改編劇情,讓閱讀變得生動有趣。

針對模糊且復雜的長鏈條需求,豆包引入了Pro模式。該模式結合了GUI模擬點擊、API工具調用以及超強推理能力,能完成以往AI根本不敢接的任務。

以巴黎旅行為例,用戶只需模糊地表達下個月去巴黎,把收藏的餐廳標到地圖上,再幫我訂一張有我喜歡展覽的博物館票,助手便能執行全流程。

它首先讀取記憶確認用戶喜愛凡高,接著搜索確認奧賽博物館正在舉辦凡高特展,隨后打開地圖應用將收藏的米其林餐廳打點,最后跳轉官網搶票并生成完整的行程單推送至備忘錄。

在展現強大能力的同時,字節跳動也極度重視隱私安全。官方反復強調,所有的記憶數據均在手機本地進行處理和加密存儲,絕對不會上傳至云端。

用戶擁有完全的控制權,隨時可以在設置中一鍵徹底關閉記憶功能。這種設計在確保了智能體驗的同時,也做到了真正的可控可信,為AI時代的隱私保護提供了新的解題思路。

頂: 932踩: 7633