背景 / 為什麼聊這個
有一個學習上的根本矛盾:好內容太多,時間太少。
一門完整的線上課程,動不動就 4、5 個小時。你買了、下載了,然後它就靜靜躺在硬碟裡。就算勉強看完,3 天後能記住的,大概不到 10%。
我一直想解決這個問題:有沒有一個方式,讓「看完影片」這件事,真的能留下有價值的東西?
今天用 Claude Code 的 /watch 視覺增強模式,做了一次完整的知識降解實驗。輸入:一部 4 小時的 Claude Code 完整課程。輸出:深度文章一篇、社群短文 10 則、SEO 優化建議,加上 133 張視覺截圖。全程耗時不到 2 小時。
核心內容
/watch 視覺模式是什麼?
一般模式下,Claude Code 只能處理文字——字幕、逐字稿、筆記。但很多課程最有價值的內容,其實在「畫面」上:投影片的架構圖、Terminal 的指令操作、只有展示沒有口頭說明的程式碼片段。
/watch 模式讓 Claude Code 真的「看得到」螢幕。它會每隔一定時間自動截圖,辨識畫面中的文字與視覺結構,並整合進最終輸出。
這是我第一次使用,對操作密集、視覺資訊豐富的技術課程來說,效果非常明顯。
知識降解工作流:3 個步驟
步驟 1:準備輸入素材
我給 Claude Code 兩樣東西:
影片的字幕檔(SRT 格式,大多課程平台都能匯出)
影片的螢幕錄製畫面(開啟 /watch 模式需要)
然後下了一個結構化的提示,指定輸出格式、語氣風格,以及優先要抓取的重點方向。
步驟 2:AI 做第一輪廣度收集
開跑之後我去做其他事。大約 40 分鐘後,第一輪輸出完成。
這一輪的任務是「廣度」:把課程中所有可能有價值的概念全部捕捉,不過濾、不主觀刪除。AI 比人更適合做這件事——它沒有注意力疲勞,也不會因為「這部分好像不重要」就跳過。
步驟 3:人工做深度過濾
這才是最花時間、也最值錢的一步(約 70 分鐘):
刪掉「正確但無聊」的段落
找出有觀點、有反差、有 insight 的內容
每一則社群短文確認有 hook、有轉折、有 takeaway
加入自己的使用經驗和評論
最終輸出:深度文章 1 篇 + 社群短文 10 則 + SEO 關鍵字清單 + 視覺截圖 133 張。
133 張截圖,是備忘錄也是素材庫
這個數字讓我自己也嚇一跳。
/watch 模式自動截圖、自動標注,把「影片哪個時間點在講什麼」全部幫你做完。這些截圖現在有三個用途:
快速回憶:不用重看影片,翻截圖就能找回任何一個知識點
社群縮圖素材:幾張截圖直接搭配社群短文,視覺效果很好
知識索引:截圖的時間戳讓你可以快速定位回影片的對應段落
我的觀點 / 實際應用
這次實驗讓我重新定義「學習效率」。
過去的邏輯是:看完 → 做筆記 → 複習,每一步都靠自己,又累又慢,而且大多數筆記做完就沒再打開過。
現在的邏輯是:AI 做廣度收集,我做深度過濾。我的時間只花在最值錢的地方:判斷什麼值得留下、加入什麼個人觀點。
幾個實際使用的注意事項:
風格需要提前校準:第一輪 AI 輸出通常語氣太「教科書」,要在提示裡明確說明你的風格,或附上幾個文章範例。
影片畫質影響截圖品質:/watch 模式對清晰度有要求,1080p 以上效果最好。
這不是「不用思考」:AI 負責收集,人負責判斷。你的眼光和品味還是整個工作流的核心。
如果你也有一堆買了沒看的課程,或是有大量影片內容要消化,這套工作流值得試試。最簡單的入門版不需要 /watch 模式,只要有字幕 + 結構化提示就能開始。
一句話總結
把 4 小時的知識壓縮成 2 小時的輸出,關鍵不是讓 AI 替你學,而是讓 AI 負責廣度蒐集,你負責深度過濾。