无心插柳的「数字镜像」
一早醒来看到 Indigo 分享了一篇文章链接,想偷懒让 agent 看看这位投资人会怎么评价。
结果 agent 没有直接去搜 Twitter,而是先调用了 Indigo 知识库——一个我几个月前搭建的东西。说实话,我都快忘了自己搭过这个。
免费 API 的"薅羊毛"
网上有不少免费的语音转录 API(Deepgram、AssemblyAI),每月有相当慷慨的免费额度。我写了一个 YouTube Transcriber skill:给一个视频链接,自动下载音频、转录、生成可读的 HTML 文稿。不想看视频的时候直接阅读,有问题还能追问 agent。
为什么不把整个频道都转了?
Indigo Talk(数字镜像)是一个投资人做的播客,人脉广、采访质量高。我关注他的 Twitter,视频也几乎全看过。
某天突然想到:所有视频都能转录,那为什么不把整个频道转了,让 agent 帮我总结,然后存成一个可以随时调用的知识库?
说干就干。批量转录、用 sub-agents 并行提取知识点、结构化存储。最终:58 集视频、726 个知识点、9 大领域、41 位嘉宾,全部变成了一个 agent skill。
然后,它自己跑起来了
回到开头那个早上。我让 agent 评价一篇关于 AI 宏观趋势的文章,期望它去搜搜推特上的讨论。但 agent 的思路比我更系统——它先读了文章全文,然后加载了 Indigo 知识库的 4 个核心领域参考文件,基于 58 集访谈和月末直播的内容,给出了一个结构化的评价:

它分析了「高度认同的部分」——AI 能力加速、SaaS 颠覆路径、白领中间层消失;也指出了「根本性分歧」——文章结论偏看跌,而 Indigo 本质上是 e/acc 看多。还引用了具体的剧集编号和嘉宾观点作为论据。
我追问「我要的是真实推文」后,它才去搜 Twitter。
关键是:agent 的思路是对的。先查本地知识库获取深度上下文,再查外部信源做交叉验证。这是我教它的吗?不是。它只是根据可用的工具,选择了最合理的执行路径。
工具会自己组合
这个分析不一定精确——知识库毕竟是从视频转录中提取的,有信息损耗。但工作流本身让我觉得很有意思。
我搭建 transcriber 是为了偷懒不看视频。批量转录是为了好玩试试。把它存成 skill 是为了以后方便查。每一步都是独立的小决定,没有宏大规划。
但当这些工具积累到一定程度,它们自己组合出了我没预料到的能力——相当于真的有了一个可以随时咨询的「数字镜像」。
无心插柳柳成荫。
如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。
Buy me a coffee