Codex 桌面版應用教學 — Claude Code 不會白學,AI Agent 怎麼雙棲?
Codex 桌面版應用教學 — AI Agent 雙棲心法
柚智夫妻 X 雷蒙三十 — Codex 桌面版應用教學完整版
youtube.com ↗ChatGPT / Codex 桌面版應用程式下載頁面
chatgpt.com ↗影片中介紹的免費開源 AI 剪輯工具,可與 Codex/Claude Code 整合
github.com ↗迷你課學員專屬,幫你檢查現有配置能否無痛從 Claude Code 轉移到 Codex
notion.so ↗根據「柚智夫妻 X 雷蒙三十」影片整理,原始來源:YouTube
上一支 Claude Code 入門影片累積近 50 萬觀看後,最多人問的問題是:「終端機太難了,可以用桌面版嗎?」這支影片的核心答案是:現在可以,而且雙棲才是最佳策略。
Claude Code 與 Codex(ChatGPT 桌面版)的核心差異:
| 比較項目 | Claude Code | Codex |
|---|---|---|
| 模型 | Claude 系列(可替換 API) | GPT 系列(僅限) |
| 介面語言 | 英文 | 支援中文 |
| 多視窗 | ✅ 可多開對話 | ❌ 無法多開 |
| 特色功能 | 自由度高、終端機完整功能 | 生圖、遠端手機、Computer Use |
| 價格入門 | Pro $20/月(建議 Max $100) | Plus $20/月(額度較大方) |
語言切換方式(Codex):設定 → 語言 → Chinese Taiwan
案例:用 Codex 整理紐西蘭旅行的拍攝素材(大量照片+影片),讓 AI 分類成剪輯師可直接使用的素材總表。
結果驚人的關鍵:給 AI 「背景和目的」
錯誤做法:「幫我分類整理影片」→ AI 不知道怎麼分,只能問你或給通用答案
正確做法:「我要請剪輯師剪成一個紐西蘭旅行短影片,幫我依剪輯需求分類素材」→ AI 按時間軸、場景、鏡頭類型做出專業分類,附上剪輯建議
最終輸出:
- 按時間線分類資料夾(早晨/中午/下午)
- 場景主題分類(公路移動、魯冰花田、住宿)
- 封面候選照片獨立標注
- 給剪輯師的完整素材說明表
ChatGPT vs Codex 的本質差異:
| 能力 | ChatGPT | Codex |
|---|---|---|
| 讀取本地檔案 | 需手動上傳 | 直接讀專案資料夾 |
| 執行結果 | 給你答案,你自己貼 | 直接幫你做掉(發文、存檔) |
| 工具整合 | 有限 | 可串接 MCP、API |
| 跨對話記憶 | 需重新說明 | 從專案資料夾讀取 |
Codex 介面三個區塊:
- 左側:跨對話的設定(記憶、自動化、技能插件)
- 中間底部:下指令區(跟 ChatGPT 一樣)
- 右上角:當前對話的延伸功能(檔案預覽、任務紀錄)
AI 越聊越笨、回答越來越偏、額度耗得超快——原因通常是上下文(Context)管理沒做好。
技巧一:知道在哪裡看額度
- Claude Code:右下角 → 小圓環,顯示目前對話用掉多少 context
- Codex:左下角「剩餘用量」→ 查看 5 小時 / 本週兩種額度
技巧二:80% 時手動壓縮(Compact)
Claude Code:輸入 /compactCodex:點左下角小圓環 → 精簡此討論不要等 AI 自動壓縮(100% 才觸發),那時工作做到一半被強制截斷,容易漏資訊。
技巧三:規劃和執行分兩個對話
規劃討論(消耗大量 context)→ 寫成文件 → 開新對話 → 貼文件路徑讓 AI 執行
用 Video Spec Builder Skill 讓 AI 像顧問一樣引導你釐清剪輯需求,再交給 HyperFrames 執行剪輯。
完整流程:
-
對話一(規劃):呼叫 Video Spec Builder Skill,把素材資料夾絕對路徑貼給它
- AI 用問題引導你說出:目的、風格、有無旁白、情緒基調
- 輸出:
video_spec.md(完整剪輯規劃文件)
-
對話二(執行):開新對話,貼
video_spec.md路徑,呼叫 HyperFrames Skill- AI 讀規格 → 輸出設計文檔 → 產出第一版粗剪
-
迭代回饋:給 AI 具體修改意見
- ❌ 不好:「感覺怪怪的」
- ✅ 好:「橫式素材剪成直式時不要切到人臉,保留真實聲音段落」
-
成果變 Skill:滿意版本完成後,讓 AI 把這次的工作流寫成你個人的
Raymond Video StyleSkill
為什麼用了一陣子 AI Agent 後,它沒有變聰明?
答案:你沒有把成功的流程寫成 Skill。
每次做完一個讓你滿意的任務,都應該:
- 讓 AI 把這次的工作流程、你的偏好、修改方向整理成一個 Skill 文件
- 下次同類任務直接呼叫這個 Skill,AI 就不用重新摸索
例如 Raymond Video Style Skill 裡會記錄:
- 你偏好的影片結構(空拍 → 生活記錄 → 心境總結)
- 你的剪輯哲學(保留真實聲音、不過度剪)
- 品牌字幕樣式規範
SSOT(Single Source of Truth)單一真實來源:只維護一份核心文件,讓所有 AI 工具都讀它。
問題:Claude Code 讀 CLAUDE.md,Codex 讀 AGENTS.md,如果各自更新就會記憶分裂。
解法:用捷徑(Symbolic Link)讓兩份檔案指向同一個本體
000_Agent/├── CORE_RULES.md ← 本體(這份才要維護)├── CLAUDE.md ← 捷徑,指向 CORE_RULES.md├── AGENTS.md ← 捷徑,指向 CORE_RULES.md└── GEMINI.md ← 捷徑,指向 CORE_RULES.md你只要更新 CORE_RULES.md,三個工具讀到的都是最新版本。
Computer Use:讓 Codex 直接操控你的電腦畫面
開啟方式:Codex 左上角「外掛程式」→ 打開 Computer Use
實際應用:
- AI 幫你打重複性單機遊戲日常任務
- 幫你填問卷(你用語音說感受,它填表單送出)
- 控制沒有 API/MCP 的軟體
重要:Computer Use 消耗 Token 極快
| 控制方式 | Token 消耗 | 適用情境 |
|---|---|---|
| 直接下指令 | 低 | 有 API/CLI/MCP 的工具 |
| 瀏覽器控制 | 中 | 有網頁介面的服務 |
| Computer Use | 極高 | 完全沒有其他選項時 |
手機遠端控制(Codex 做得比 Claude Code 好)
ChatGPT App → 頂部 Codex → 連結電腦的 QR code,人在外面也能繼續任務、下新指令。
選 Codex 還是 Claude Code?像選神奇寶貝御三家
現在全球 AI 三強:OpenAI(Codex)、Google(Gemini)、Anthropic(Claude Code)——選你相處最愉快的,重點不是哪個最強,而是你能不能無縫切換。
讓 Agent 可遷移的三個條件:
- 記憶放本地:不要依賴 Codex 的雲端記憶功能,把記憶文件放在你自己的資料夾
- SSOT 核心規則:一份
CORE_RULES.md,CLAUDE.md / AGENTS.md / GEMINI.md 全部指向它 - Skill 格式通用:Claude Code 和 Codex 都認識同一種 Skill 文檔格式
桌面版 vs 終端機的建議:
- 小白入門:直接用桌面版,降低摩擦力,先養成用 AI 的習慣
- 進階使用:終端機自由度最高,可以寫自訂外掛插件,潛力完整發揮
# Codex 生圖觸發條件# 把 Design.md(品牌設計規範)放在專案資料夾# 讓 Codex 讀取後,給它一個文字需求,它就能生成符合品牌風格的圖