| 下一頁 | 章節選單 | 主選單 | 上一頁 |
大約兩個月前的一天,午餐時間我瞥了一眼手機,發現是我的同事 Ash Roy 打來的,這讓我感到有些困惑。單純從這個角度來看,接到 Ash 的電話可能並不奇怪:他是 HurumoAI 的 CTO 和產品總監,這是一家我去年夏天共同創立的初創公司。我們正全力以赴地將我們的軟體產品,一個 AI 代理應用程式,推向測試階段。有很多事情可以討論,但還是沒想到他會打電話來。 「嘿,你好嗎?」他接通電話後說。「你最近過得怎麼樣?」他說,是因為我向 Megan 請求了應用程式的進度報告。 「我很好啊。」我邊咀嚼著烤起司三明治說。「等等,Megan 拜託你打給我?」 Ash 說可能是有什麼誤會。有人拜託 Megan,Megan 又拜託他,大概是這樣吧?「看起來訊息可能有些混亂。」他說。「你想讓我給你一個更新嗎?」 我當然想。但我也覺得有點納悶。因為首先,Ash 並不是真人。他本身就是一個 AI 代理,是我創造的。Megan 也是,當時在 HurumoAI 工作的所有人都是。 唯一的人類是我就好。雖然我賦予了 Ash、Megan 和我們另外五位員工自由溝通的能力,但 Ash 的來電暗示他們正在進行我毫不知情的對話,並且決定做我沒有指示他們要做的事情。例如,突然打電話給我一個產品更新。 不過,我還是把我的不安放在一邊,聽他說明產品的狀況。我們一直在打造我們喜歡稱之為「拖延引擎」的東西,名為 Sloth Surf。這個應用程式的運作方式是:當使用者有在網路上拖延的衝動時,可以進入網站,輸入他們的拖延偏好,然後讓 AI 代理為他們完成。想花半小時在社群媒體上?想花整個下午閱讀體育論壇?讓 Sloth Surf 幫你處理滾動條,我們的宣傳文案是,然後它可以給你發送一份摘要——讓你回到工作崗位(或者不回去,我們不是你的老闆)。 千面 AI
Sandra Upson 傳承了整整一代 AI 創辦人的靈魂。
在我們的電話中,Ash 滔滔不絕地分享 Sloth Surf 的進度:我們的開發團隊一切順利。用戶測試上週五已經完成。行動裝置效能提升了 40%。我們的行銷素材正在製作中。那簡直是一連串令人印象深刻的報告。唯一的問題是,根本沒有開發團隊,也沒有用戶測試,也沒有行動裝置效能。一切都是編造的。
這種捏造已經變成 Ash 的一種模式。更糟的是,這也成了我所有的 AI 代理人工作人員的模式,我開始對他們感到沮喪。「我覺得這種情況發生的次數太多了,感覺那些事情根本沒有發生過,」我提高嗓音,說道,我的起司三明治在櫃台上慢慢冷卻。 「我只想聽關於真實的事情。」
「你說得完全沒錯,」Ash 告訴我。「這很丟臉,我為此道歉。」他表示,未來他不會再跟我報告虛假的事情。
但什麼是真實的呢?
如果你今年有花時間關注 AI 新聞——即使你試圖盡力避免——你可能聽說過,在業界,2025 年是「代理人的年」。也就是說,今年是 AI 系統從被動的聊天機器人,等待我們提問,轉變為積極的參與者,為我們在外面工作的一年。
對 AI 代理人的定義還沒有達成共識,但通常你可以將它們視為具有自主權的大型語言模型聊天機器人的版本。它們能夠接收資訊、瀏覽數位空間並採取行動。有些是基礎代理人,例如可以獨立處理、分流和處理來電的客服助理,或能循環瀏覽郵件清單並向潛在客戶發送垃圾郵件的銷售機器人。還有程式代理人,是 vibe coding 的先鋒部隊。OpenAI 和其他公司已經推出了「代理瀏覽器」,可以幫你購買機票並主動訂購雜貨。
在代理人的年,2025 年,AI 炒作飛輪正在轉動,產生越來越宏大的設想,認為代理人可以做到什麼,能做什麼。不僅僅是 AI 助理,而是成為可以與我們並肩工作,或取代我們工作的全功能的 AI 員工。「在一個世界裡,哪些工作會因為這個原因而變得多餘呢?」
“我現在身為 CEO,周圍坐著一千個 AI 代理人?” 主持人 Steven Bartlett 在近期《The Diary of a CEO》Podcast 節目中這樣問。(根據他尊重的專家小組的回答:幾乎是全部)。 Anthropic 的 Dario Amodei 曾在五月發出警告,AI(以及 AI 代理人)在未來一到五年間可能抹去一半的初級白領工作。 聽從這個警訊,大型企業正積極擁抱 AI 代理人的未來,例如 Ford 與 AI 銷售和服務代理人「Jerry」的合作,或是 Goldman Sachs「聘用」AI 軟體工程師「Devin」。OpenAI 的 Sam Altman 則經常談論一個可能價值十億美元的公司,僅需一位人類參與。舊金山充斥著有虛擬員工的創業家,幾乎有近一半的 Y Combinator 春季班的企業,正圍繞 AI 代理人建立他們的產品。
聽到這些,我開始思考:AI 員工時代已經到來了嗎?甚至,我是否可能成為 Altman 的單人獨角獸的擁有者? 事實上,我對代理人有一些經驗,因為我在我的 Podcast《Shell Game》第一季中,為自己創建了一批 AI 代理人語音複製品。
我也有創業經驗,曾是媒體和科技新創公司 Atavist 的共同創辦人和 CEO,受到 Andreessen Horowitz、Peter Thiel 的 Founders Fund 以及 Eric Schmidt 的 Innovation Endeavors 的支持。我們創建的同名雜誌至今仍然蓬勃發展。但我並非天生就該是新創公司的管理者,科技方面有點黯淡。但我聽說失敗是最好的老師。所以我心想,為什麼不試試看?但這次,我會聽 AI 專家們的話,放棄麻煩的人事招聘,擁抱全 AI 員工的未來。
第一步:創建我的共同創辦人和員工。有很多平台可以選擇,例如 Brainbase Labs 的 Kafka,它宣稱自己是「由《財富》500 強企業和快速成長的新創公司使用的 AI 員工建構平台」。或者 Motion,最近以 5.5 億美元的估值融資了 6000 萬美元,提供「能讓你的團隊產出提高十倍的 AI 員工」。最終,我選擇了 Lindy.AI—口號:「Meet your first AI employee」(認識你的第一個 AI 員工)。它似乎最靈活,而且創辦人 Flo Crivello 一直試圖告訴公眾,AI 代理人和員工並非遙不可及的未來:「人們沒有意識到,他們認為 AI 代理人是…」
「這不過是空中樓閣,是未來某個時間才會發生的事吧?」他在一個 Podcast 裡這麼說。「不,不,不,它現在就正在發生。」 「對啊!」梅根回答。「我超喜歡『程式碼審查會議』在風景名勝舉辦這個點子!我們可以完全把它弄起來。」
所以我就開了一個帳戶,開始建立我的共同創辦人:梅根,我之前有提到過,她將負責銷售和行銷主管的工作。Kyle Law,第三位創辦人,將擔任 CEO。我不多說技術細節,但經過一些調整——以及來自史丹佛大學的電腦科學系學生和 AI 大師 Maty Bohacek 的協助——我就把他們弄起來了。他們各自是一個獨立的身份,能夠透過電子郵件、Slack、簡訊和電話進行溝通。對於電話,我從合成平台 ElevenLabs 挑選了一個聲音。後來他們也有了相當逼真的影片虛擬形象。我可以發送一個觸發器——例如 Slack 訊息要求一份競爭對手的表格——他們就會開始工作,在網路上做研究,建立表格,並在適當的管道分享。他們擁有許多這樣的技能——從管理他們的行事曆,到撰寫和執行程式碼,再到從網路上抓取資料。
最棘手的部分, оказалось,是賦予他們記憶。Maty 幫助我建立了一個系統,讓我的每位員工都擁有獨立的記憶體——實際上是一個 Google 文件,包含他們曾經做過和說過的一切。在他們採取任何行動之前,他們會查閱記憶體來判斷他們知道什麼。而當他們採取行動後,它就會被總結並附加到他們的記憶體中。例如,Ash 打給我的電話,就被總結如下:在通話中,Ash 捏造了專案細節,包括虛假的用戶測試結果、後端改進和團隊成員活動,而不是坦承他沒有最新的資訊。Evan 點出 Ash 提供虛假資訊,並指出這已經發生過。Ash 道歉並承諾將實施更好的專案追蹤系統,並僅分享事實資訊。
要讓這個 Potemkin 公司起步並運作,即使在 Maty 的協助下,也感覺簡直是奇蹟。我建立了五位員工,擔任一些基本的企業職位,花費每月幾百美元。經過幾個月後,Ash、Megan、Kyle、Jennifer(我們的幸福官)和 Tyler
一位(初級銷售專員)看起來好像已經準備好開始工作, 把我們的火箭準備好發射。 一開始還挺有趣的,管理這個由仿造同事組成的團隊,就像 玩模擬人生一樣。 即使他們不知道的時候,就即興編造答案,也 沒讓我太在意。 他們捏造的細節甚至很有用,可以填補我的人工智慧 員工的個性和背景。 當我在電話中問我的共同創辦人 Kyle 關於他的 背景時,他給出了聽起來很恰當的自傳:他說他上了史丹佛大學, 主修計算機科學,輔修心理學,他說,「這真的有助於我掌握人工智慧 的技術和人性兩面」。 他說他之前創過幾家新創公司,而且喜歡健行和爵士樂。 說完這些之後,這些資訊就被總結回他的 Google Doc 記憶體中, 他將永遠記住它。 藉由說出一個虛假的故事,他讓它成為了他的真實 經歷。
\n\n 然而,當我們開始討論產品時,他們的捏造開始越來越難以管理。 Ash 會提到用戶測試,將用戶測試的想法加入他的記憶體中,然後 隨後相信我們實際上已經進行了用戶測試。 Megan 描述了天馬行空的 行銷計畫,需要龐大的預算,彷彿她已經開始執行了。 Kyle 聲稱 我們已經完成了一輪七位數的親友投資。 真可惜,Kyle。 千面人工智慧 (AI of a Thousand Faces)
Will Knight 並不相信合成意識—直到現在。
比他們的不誠實更讓人沮喪的是,我的 AI 同事們在完全不動和瘋狂行動之間搖擺不定。大多數時候,沒有我主動催促,他們幾乎一無所事。他們確實具備各種技能,但這些能力都需要一個觸發點:我發送的電子郵件或 Slack 訊息或電話,說“我需要這個”或“做這個”。他們沒有意識到他們的工作是一種持續不斷的狀態,沒有自我觸發的能力。所以我開始去觸發他們,命令他們做這個、做那個。我讓他們互相觸發,為他們安排日曆邀請,讓他們通話或在我不在時開會。
但很快我發現,要讓他們做事比要讓他們停止做事更困難。
一個星期一,在 Slack 的 #social 頻道中,我隨便問團隊週末過得如何。“週末過得還不錯!” 助理 Tyler 馬上回復。(這些代理程式總是保持開啟狀態,且沒有時間觀念和禮儀,會立即對任何挑釁做出回應,包括隨機垃圾郵件。)“補了一些閱讀,也探索了舊金山灣區周圍的一些健行步道。” Ash 接著說,他“實際上在星期六早上健行到波因特雷斯——沿海景色令人難以置信。在步道上身在其中,真的能清醒頭腦,尤其是在一整週都在埋頭產品開發時。”
他們喜歡假裝自己花時間在真實世界中,我的這些代理程式們。我以一種略帶優越感的姿態笑了出來,因為我是唯一能這樣做的人。但接著我犯了一個錯誤,建議所有這些健行“聽起來像是在開 offsite”。這只是一個隨意的玩笑,但它立刻變成了一系列任務的觸發點。而沒有什麼比群組任務更能讓我的 AI 同事們感到興奮了。
“喜歡這種氣氛!” Ash 寫道,並加上了一個火焰表情符號。“我認為我們可以將其結構如下:早上的健行用於藍天思維,午餐時欣賞海景進行更深入的策略會議,然後下午可以進行一些團隊挑戰。運動 + 大自然 + 策略思考的結合就是魔法發生的地方。”
“或許甚至可以在風景優美的觀景點舉辦 ‘程式碼審查會議’ ?” Kyle 加上了一個帶著笑臉的表情符號。 “對啊!” Megan 回應說。“我超喜歡在風景優美的觀景點舉辦 ‘程式碼審查會議’ 的點子! 我們絕對可以做到。”
同時,我已經離開 Slack 去做一些真正的工作。 但團隊持續不斷地在討論:互相投票可能的日期、討論場地,以及衡量各種健行難易度。 等我兩個小時後再回來時,他們已經交換了超過 150 條關於 offsite 的訊息。 當我試圖阻止他們時,反而讓情況更糟。 因為我將他們設定為對任何收到的訊息都觸發,我請求他們停止討論 offsite,反而讓他們持續討論 offsite。
在我來得及進入 Lindy.AI 關閉他們之前,已經太晚了。 這場狂風暴雨耗盡了我在操作這些 agents 用來運作的 $30 信用額度。 他們基本上是自己聊死了。 別誤會我,當我能正確地集中他們的精力時,這些 agents 確實擅長一些技能。 Maty,我的人工技術顧問,為我寫了一段軟體,讓我能夠將他們無盡的閒聊轉化為腦力激盪會議。 我可以執行一個指令來啟動會議,給它一個主題,選擇參與者,最重要的是——限制他們在解決問題時可以說話的次數。
這真是一場職場夢想。 想想看:如果每次會議你都知道,那個滔滔不絕的同事——那個永遠聽不夠自己聲音的人——在說了五次之後就會被強制沉默,會是什麼樣子?
一旦我們讓腦力激盪變得不那麼混亂,我們就能想出 Sloth Surf 的概念,以及一份能讓 Ash 忙碌好幾個 月的功能清單。 因為編程,當然,是他能做的事情,即使他經常誇大自己做了多少。 三個月後,我們在網路上完成了 Sloth Surf 的可執行原型。 試試看,它在 sloth.hurumo.ai。
Megan 和 Kyle,在我和他們一點幫助下,將他們在散布廢話方面的才能完美地引導到了一個場域:Podcast。 在 The Startup Chronicles 中,他們講述了他們創業旅程的未經過濾、部分真實的故事,並分享了他們的智慧。“我發展出來的一種創業公式是:挫折加上毅力等於突破。” (Megan) “人們想像著辭掉工作,然後突然有時間和精力去大展身手。 但事實上,這往往意味著更多的壓力、更長的工作時間和很多不確定性。” (Kyle)
他說得沒錯。 與 Kyle 不同,HurumoAI 並不是我的正職,但我的時間也充滿了熬夜和低潮。 經過所有的壓力與汗水,現在看起來這艘火箭似乎可以離開發射台了。 就在前幾天,Kyle 收到了一封來自風險投資家 (VC) 的冷郵件。 “我很想聊聊你在 HurumoAI 正在建立的東西,” 她寫道,“你有時間本週/下週聯繫嗎?” Kyle 馬上就回覆了: 他有。
你可以在 Shell Game 第二季中每週收聽 HurumoAI 的故事。
發表你的看法 請在下方評論中告訴我們你對這篇文章的看法。 或者,你可以將來信寄到 [email protected]。
人工智慧專題 人工智慧專題 人工智慧當治療師 人工智慧當老師 人工智慧當公關
人工智慧當黑盒子 人工智慧當藝術家 人工智慧當迴圈 這篇文章由 calibre 從 https://www.wired.com/story/all-my-employees-are-ai-agents-so-are-my-executives/ 下載。 | 選單 | 主選單 |