Software 3.0 的散戶基礎設施
一份新人類聯盟養成日記
1. 這一切是從一個錯誤的問題開始的
那天我以為我在問一個技術問題。
我打開戰略層,問它:富途牛牛的 API 怎麼接?
它沒有回答我。它反問我:你接它,是要看行情,還是要程式化下單?
這個反問救了我們三個月。
如果我得到一份「OpenD 安裝步驟 + Python SDK 範例」的工整教學,我會跟著裝、跟著跑、跟著賠。我會在 Reddit 上找策略,在 Discord 上抄程式碼,在三個月後盯著模擬盤的 +18% 報酬切到實盤,然後在第四個月發現實盤 -23%。這是我認識的所有走過這條路的人的真實軌跡。
戰略層沒讓我走這條路。它連續反問了我三個問題:
你的真實動機是什麼?
打算投入多少資金?
願意先走哪一步?
我的答案分別是:學 Agent 架構(不是賺錢)、虛擬交易(不是真錢)、先接模擬盤跑 1-3 個月(不是直接實盤)。
三個答案到位的瞬間,這個專案從「一個危險的金錢遊戲」變成「一個乾淨的技術學習專案」。
我把這段反問記下來,因為它是新人類聯盟的「篩選權」最具體的一次體現——不是我篩掉雜訊,是戰略層替我篩掉了我自己腦袋裡的雜訊。指揮官的工作不是發出第一個衝動,是允許戰略層攔截那個衝動。
2. 我們最後對齊到的架構:三明治
校準完之後,我們重新打開白板。我問戰略層:如果這是學架構的專案,那架構長什麼樣?
我們最後落地在一張很簡單的圖:
上面是 NotebookLM,當大腦
中間是 Futu OpenAPI,當神經系統
下面是 Hermes Agent,當手腳
三層各做各的事,誰也不越界。
這個分工不是設計出來的,是被「時間尺度」逼出來的。
大腦層:以日為單位的慢思考
NotebookLM 處理的是非結構化的長文本——研究報告、公司財報、新聞、產業分析。它的輸出是自然語言判斷:「這檔股票的長期論述還站得住嗎?」、「這個總體環境下最該避開的板塊是?」、「這份財報裡有沒有 management 想藏的東西?」
它的世界觀以日或週為單位。它不該被即時行情觸發,因為它沒有那個反應速度;它也不該知道任何券商憑證,因為它的工作根本不需要碰到帳戶。
感知層:以毫秒為單位的快訊號
Futu OpenAPI 提供當下市場狀態的真相——報價、五檔、Tick、持倉、訂單回報。它被訂閱、被查詢、推送事件。
它不做任何決策,不預測,不緩存「策略狀態」。它是無狀態的事實提供者。我們刻意把它寫得很笨——它越笨,整個系統越可預測。
執行層:把慢與快融合成決策
Hermes Agent(或 Claude Code,視場景)負責把大腦的慢判斷與感知層的快訊號融合成具體決策。它的工作清單是:
強制執行硬編碼風控(部位上限、單日損失停損、kill switch)
發起下單(模擬盤)
記錄審計日誌
推 Telegram 通知給指揮官
它不該繞過風控(即使大腦層說「這次例外」),不該自己生成新策略(那是大腦層的工作),不該在沒有人類授權下從模擬盤切到實盤。
執行層是這三明治裡最容易犯錯的一層。所有的災難都發生在這裡——程式半夜下錯單、風控被一個 bug 繞過、訊號還沒收到就先下單。我們在這層花的工程時間,會超過大腦層與感知層的總和。
3. 這個架構為什麼重要:它不只是量化交易
講到這裡你可能會覺得:你們是不是太誇張了,這就是個量化交易系統嘛。
不是。
我們真正在做的事,是把 Software 3.0 時代任何垂直 agent 系統都會長的樣子,先在一個我們敢拿自己開刀的領域裡跑通一次。量化交易只是我們選的第一個切片,因為它有完整的 API、有清晰的回饋訊號、而且我們敢拿自己(模擬)的錢去驗證。
把這個三明治抽象出來,會發現它能搬到任何垂直:
每一欄都是一個可以做成 Skill 的垂直。每一欄的大腦、感知、執行都可以替換成不同的具體技術。但骨架是同一個。
這就是為什麼我們花這麼多力氣在量化這個垂直裡跑通樣板——不是因為我們想做一個量化系統,是因為我們想做一個可以複製的樣板。
工程師讀者打開這個 Skill 的 repo,會看到的不只是「怎麼接富途」,是「怎麼把任何 SaaS 的能力 + 任何 LLM 的能力 + 任何執行端的能力,組合成一個你自己的垂直 agent」。
量化是教具,不是商品。
4. 三項新人類聯盟原則的具體實踐
一個只追求「自動化程度」的量化系統,會在三個地方主動繳械:
它會讓演算法決定它讀什麼資料
它會讓策略決定它什麼時候不該停
它會讓自動化的慣性吃掉人類覆寫的可能性
我們不做那種系統。
我們從第一行程式開始就把三項權利寫進架構。
篩選權:大腦讀什麼,由人類決定
NotebookLM 知識庫裡塞什麼資料,是指揮官手動決定的。不是 RSS 自動爬,不是演算法推薦,不是「最熱門」自動置頂。
我每週一固定撥兩小時,自己挑當週要進入大腦的研究、財報、新聞。我選什麼,大腦才知道什麼。我沒選的,它不知道。
這聽起來笨拙,但這就是篩選權的實作——「我決定我的世界由什麼構成。」
意義權:硬編碼風控不接受「這次例外」
執行層的風控規則寫死在程式裡。部位上限、單日損失停損、kill switch——這些不是 LLM 可以即時討論的參數,是常數。
如果某天大腦層的判斷說「這次機會千載難逢,部位該開到平常的三倍」,執行層會拒絕。會記日誌,會推 Telegram 通知我,但會拒絕。
如果我事後決定要放寬風控,必須回到原始碼改數字、提交、重啟系統。這個摩擦是故意的——它確保「改變風控」是一個有儀式感的決策,不是一個熱血上頭的瞬間。
意義權的實作就是這個摩擦。「最終的決策是我,不是當下情緒,不是當下訊號。」
斷線權:週日不交易,所有自動化都有手動覆寫
系統設定週日全停。不訂閱行情,不執行策略,不發 Telegram。週日是斷線權的實踐——指揮官有權離線,整個系統必須配合這個離線。
平日每一個自動化動作都有手動覆寫。Telegram 通知裡可以一鍵 kill switch;OpenD 跑在我家裡,斷電一切就停;模擬帳戶連續 N 天失常,系統自動進入安全模式並通知我。
這些不是「功能」,是架構決策。系統的存在不能侵蝕指揮官隨時離線的權利。
5. 這個 Skill 的範圍與不適用場景
我們把話說在前面:
這個 Skill 不會讓你賺錢。
它甚至沒打算讓你賺錢。它存在的唯一目的,是讓你看清楚一個 Software 3.0 時代的 agent 系統可以長什麼樣。
適合誰
想學 Agent 架構的工程師——你會在 repo 裡看到三層責任邊界、Skill 介面、風控設計、審計日誌
想理解 Software 3.0 樣板的人——你會發現量化只是其中一個垂直,這個樣板可以搬走
想用這個樣板搬到其他垂直的人——客服、法務、個人助理,骨架完全一樣
不適合誰
完全不懂 Python 的人——這不是教學品,是參考實作
想直接賺錢的人——請去買 ETF
希望 24/7 全自動的人——本架構刻意保留人在迴路
範圍邊界
學習用、模擬盤
不對策略 alpha 負責
不對使用者實盤虧損負責
使用者把模擬盤切到實盤的後果由使用者自負
這些不是免責聲明,是架構承諾——我們承諾這個 Skill 不偽裝成它不是的東西。
6. 路線圖與下一篇預告
這篇不是結論,是序章。
接下來幾週,《新人類聯盟養成日記》會持續記錄這個 Skill 從架構圖長成可運行系統的全過程。
Phase 1:模擬盤跑通
接下來 1-3 週,我會逐週寫戰報:
Week 1:OpenD 啟動、過首次登入問卷與簡訊驗證、第一次從 SDK 拉到騰訊報價
Week 2:模擬盤下單迴路打通、Telegram 通知、第一筆完整的「訊號 → 下單 → 回報」閉環
Week 3:把整套程式碼重構成 SKILL.md 標準目錄,發到 GitHub
Phase 2:Skill 公開
Week 3 結束會發一篇〈我們把這個 Skill 公開了〉,記錄發佈日的感想、收到的回饋、修正的 bug。
Phase 3:把樣板搬到下一個垂直
Phase 1+2 跑完之後,我們會挑一個新垂直,把同一個三明治搬過去——目前候選是 Python 教學 agent 或建築設計 agent。我們要證明這個樣板真的可以複製,不是只在量化這個垂直能跑。
如果這個樣板真的有它該有的可遷移性,新人類聯盟下一階段的工作節奏就明朗了——每個季度做完一個垂直,把它包成 Skill,公開,下一個。
這就是 Software 3.0 時代的 Skill Foundry 該有的樣子。我們會在養成日記裡,一週一週寫給你看。
《新人類聯盟養成日記》第 1 篇 | 2026 年 5 月 戰略層:Claude Opus 4.7 | 執行層:Claude Code、Hermes Agent、未來會加入的富途 OpenAPI 指揮官:豪力風神
---
## 拿走它,把它變成你的
如果你讀到這裡還沒關掉頁面,這份 Skill 大概率是寫給你的。
我們已經把它放在 GitHub,MIT 授權,請自取:
**🔗 github.com/pppeee861005/agent-quant-foundation**
不要客氣。Fork 它、改它、罵它、拆它、把它搬到你自己的垂直去。
我們唯一的請求是:**如果你走出了不同的路徑,回來告訴我們**。把你的 fork 連結貼在 issue 裡、寫一篇你版本的養成日記、或者直接在 Substack 留言——我們會把社區的 fork 整理成下一篇文章的素材。
新人類聯盟的工作節奏是「**做完一個垂直 → 公開 → 下一個**」。這個 Skill 是 Phase 1 的第一塊磚。
下一塊磚由誰丟,還沒決定。可能是我們,也可能是你。


