粹 學
跳到內容

Codex 桌面版應用教學 — Claude Code 不會白學,AI Agent 怎麼雙棲?

AI Agent 工具實戰

Codex 桌面版應用教學 — AI Agent 雙棲心法

觀看原始 YouTube 本文根據原 YouTube 整理,版權歸原作者所有
原始影片(YouTube)

柚智夫妻 X 雷蒙三十 — Codex 桌面版應用教學完整版

youtube.com ↗
Codex 官方下載

ChatGPT / Codex 桌面版應用程式下載頁面

chatgpt.com ↗
HyperFrames AI 剪輯套件 免費

影片中介紹的免費開源 AI 剪輯工具,可與 Codex/Claude Code 整合

github.com ↗
Pro Kit 08:AI Agent 雙棲健檢助手 迷你課

迷你課學員專屬,幫你檢查現有配置能否無痛從 Claude Code 轉移到 Codex

notion.so ↗

根據「柚智夫妻 X 雷蒙三十」影片整理,原始來源:YouTube

上一支 Claude Code 入門影片累積近 50 萬觀看後,最多人問的問題是:「終端機太難了,可以用桌面版嗎?」這支影片的核心答案是:現在可以,而且雙棲才是最佳策略。

Claude Code 與 Codex(ChatGPT 桌面版)的核心差異:

比較項目Claude CodeCodex
模型Claude 系列(可替換 API)GPT 系列(僅限)
介面語言英文支援中文
多視窗✅ 可多開對話❌ 無法多開
特色功能自由度高、終端機完整功能生圖、遠端手機、Computer Use
價格入門Pro $20/月(建議 Max $100)Plus $20/月(額度較大方)

語言切換方式(Codex):設定 → 語言 → Chinese Taiwan


案例:用 Codex 整理紐西蘭旅行的拍攝素材(大量照片+影片),讓 AI 分類成剪輯師可直接使用的素材總表。

結果驚人的關鍵:給 AI 「背景和目的」

錯誤做法:「幫我分類整理影片」→ AI 不知道怎麼分,只能問你或給通用答案

正確做法:「我要請剪輯師剪成一個紐西蘭旅行短影片,幫我依剪輯需求分類素材」→ AI 按時間軸、場景、鏡頭類型做出專業分類,附上剪輯建議

最終輸出:

  • 按時間線分類資料夾(早晨/中午/下午)
  • 場景主題分類(公路移動、魯冰花田、住宿)
  • 封面候選照片獨立標注
  • 給剪輯師的完整素材說明表

ChatGPT vs Codex 的本質差異:

能力ChatGPTCodex
讀取本地檔案需手動上傳直接讀專案資料夾
執行結果給你答案,你自己貼直接幫你做掉(發文、存檔)
工具整合有限可串接 MCP、API
跨對話記憶需重新說明從專案資料夾讀取

Codex 介面三個區塊

  • 左側:跨對話的設定(記憶、自動化、技能插件)
  • 中間底部:下指令區(跟 ChatGPT 一樣)
  • 右上角:當前對話的延伸功能(檔案預覽、任務紀錄)

AI 越聊越笨、回答越來越偏、額度耗得超快——原因通常是上下文(Context)管理沒做好

技巧一:知道在哪裡看額度

  • Claude Code:右下角 → 小圓環,顯示目前對話用掉多少 context
  • Codex:左下角「剩餘用量」→ 查看 5 小時 / 本週兩種額度

技巧二:80% 時手動壓縮(Compact)

Claude Code:輸入 /compact
Codex:點左下角小圓環 → 精簡此討論

不要等 AI 自動壓縮(100% 才觸發),那時工作做到一半被強制截斷,容易漏資訊。

技巧三:規劃和執行分兩個對話

規劃討論(消耗大量 context)→ 寫成文件 → 開新對話 → 貼文件路徑讓 AI 執行


Video Spec Builder Skill 讓 AI 像顧問一樣引導你釐清剪輯需求,再交給 HyperFrames 執行剪輯。

完整流程:

  1. 對話一(規劃):呼叫 Video Spec Builder Skill,把素材資料夾絕對路徑貼給它

    • AI 用問題引導你說出:目的、風格、有無旁白、情緒基調
    • 輸出:video_spec.md(完整剪輯規劃文件)
  2. 對話二(執行):開新對話,貼 video_spec.md 路徑,呼叫 HyperFrames Skill

    • AI 讀規格 → 輸出設計文檔 → 產出第一版粗剪
  3. 迭代回饋:給 AI 具體修改意見

    • ❌ 不好:「感覺怪怪的」
    • ✅ 好:「橫式素材剪成直式時不要切到人臉,保留真實聲音段落」
  4. 成果變 Skill:滿意版本完成後,讓 AI 把這次的工作流寫成你個人的 Raymond Video Style Skill


為什麼用了一陣子 AI Agent 後,它沒有變聰明?

答案:你沒有把成功的流程寫成 Skill。

每次做完一個讓你滿意的任務,都應該:

  1. 讓 AI 把這次的工作流程、你的偏好、修改方向整理成一個 Skill 文件
  2. 下次同類任務直接呼叫這個 Skill,AI 就不用重新摸索

例如 Raymond Video Style Skill 裡會記錄:

  • 你偏好的影片結構(空拍 → 生活記錄 → 心境總結)
  • 你的剪輯哲學(保留真實聲音、不過度剪)
  • 品牌字幕樣式規範

SSOT(Single Source of Truth)單一真實來源:只維護一份核心文件,讓所有 AI 工具都讀它。

問題:Claude Code 讀 CLAUDE.md,Codex 讀 AGENTS.md,如果各自更新就會記憶分裂。

解法:用捷徑(Symbolic Link)讓兩份檔案指向同一個本體

000_Agent/
├── CORE_RULES.md ← 本體(這份才要維護)
├── CLAUDE.md ← 捷徑,指向 CORE_RULES.md
├── AGENTS.md ← 捷徑,指向 CORE_RULES.md
└── GEMINI.md ← 捷徑,指向 CORE_RULES.md

你只要更新 CORE_RULES.md,三個工具讀到的都是最新版本。


Computer Use:讓 Codex 直接操控你的電腦畫面

開啟方式:Codex 左上角「外掛程式」→ 打開 Computer Use

實際應用:

  • AI 幫你打重複性單機遊戲日常任務
  • 幫你填問卷(你用語音說感受,它填表單送出)
  • 控制沒有 API/MCP 的軟體

重要:Computer Use 消耗 Token 極快

控制方式Token 消耗適用情境
直接下指令有 API/CLI/MCP 的工具
瀏覽器控制有網頁介面的服務
Computer Use極高完全沒有其他選項時

手機遠端控制(Codex 做得比 Claude Code 好)

ChatGPT App → 頂部 Codex → 連結電腦的 QR code,人在外面也能繼續任務、下新指令。


選 Codex 還是 Claude Code?像選神奇寶貝御三家

現在全球 AI 三強:OpenAI(Codex)、Google(Gemini)、Anthropic(Claude Code)——選你相處最愉快的,重點不是哪個最強,而是你能不能無縫切換。

讓 Agent 可遷移的三個條件

  1. 記憶放本地:不要依賴 Codex 的雲端記憶功能,把記憶文件放在你自己的資料夾
  2. SSOT 核心規則:一份 CORE_RULES.md,CLAUDE.md / AGENTS.md / GEMINI.md 全部指向它
  3. Skill 格式通用:Claude Code 和 Codex 都認識同一種 Skill 文檔格式

桌面版 vs 終端機的建議:

  • 小白入門:直接用桌面版,降低摩擦力,先養成用 AI 的習慣
  • 進階使用:終端機自由度最高,可以寫自訂外掛插件,潛力完整發揮
# Codex 生圖觸發條件
# 把 Design.md(品牌設計規範)放在專案資料夾
# 讓 Codex 讀取後,給它一個文字需求,它就能生成符合品牌風格的圖