Posts 生成式AI的崛起32:人类沟通的带宽太低了
Post
Cancel

生成式AI的崛起32:人类沟通的带宽太低了

– by Mohamed Nohassi in Unsplash

最近用 AI 用多了,我发现一个很尴尬的事实。不是 AI 不聪明,是我这个人,接口太差。

事情经常是这样的。我让 Agent 去查一组数据,非常自信地告诉它,我关心属性 A,也关心属性 B。说完以后,我还会产生一种错觉,觉得自己表达得挺清楚,像一个成熟的产品经理,甚至有那么一瞬间想给自己点个赞。

然后 Agent 就去了。我也坐在那儿,等着它把活干完。过了一会儿,我突然想起来,我其实只想看最近两个星期的数据。

你看,精彩的地方来了。这个条件不是刚刚诞生的。它一直在我脑子里。它在里面坐得稳稳当当,像一个老员工,可能还端着保温杯。可我开口的时候,它就是没出来。

于是我只好把 Agent 叫停,补一句,哦对了,只看最近两周。

这句话看起来很轻,像顺手往锅里加了一点盐。但对协作来说,它已经算一次小型返工了。Agent 重新查,我重新等,刚才顺着任务冒出来的想法也被掐断。最惨的是,这一切还不能怪它。

它又没有读心术。虽然我有时候对 AI 的要求,已经无限接近你怎么连我没说的话都不知道。这就很离谱。

我一边感叹 AI 还不够懂我,一边忘记自己刚才根本没说。愚钝如我,还试图把锅甩给硅基生命,多少有点不讲武德。

这类事情最近发生了好几次。每次都是我说完一个需求,Agent 开始执行,我突然从脑子角落里翻出一个约束、一个偏好、一个背景,然后像补作业一样补给它。

哦对了,这个只看最近两周。哦对了,输出先给结论。哦对了,这几个项目别漏。哦对了,别写得像年终总结。你发现没有,人生很多崩溃都发生在哦对了后面。

所以我现在越来越觉得,AI 协作里有一个问题被我们低估了。我们总是在讨论模型能力,工具调用,推理深度,Agent 能不能自己拆任务,自己调 API,自己写代码。

这些当然重要。但还有一个更朴素、更让人羞愧的问题。人类到底有没有能力,把脑子里的上下文完整传出去。答案大概率是,没有。

人的脑子不是文档。人的脑子更像一个临时堆满东西的桌面。目标、背景、偏好、限制、恐惧、经验、前几次踩过的坑,全都摊在上面。有的文件夹还叫新建文件夹 7。

但我们一说话,就必须把这些东西排成一条线。一句一句说,一个字一个字写。

明明脑子里是立体的,出来的时候变成了流水账。明明有十几个条件同时存在,嘴巴一次只能放行一个。最可怕的是,嘴巴还经常安检不严,该出来的没出来,不该出来的废话出来一堆。

口头和文字,就是人类最常用的低带宽接口。

跟人沟通的时候,这个接口勉强还能用。大家都这么多年了,已经习惯彼此漏风。你跟同事解释一个需求,说一半对方问一句,你是不是想要那个,然后你说对对对,就是那个。大家靠默契、眼神、历史包袱和共同受苦经验,把这事儿糊过去。

人和人之间还有一个好处,就是不需要所有信息都同步。有些事说太多会烦,有些事说太透会尴尬,有些事你不说,对方也懂,懂了也假装没懂,这就是成年人世界最后的体面。

但跟 Agent 协作,情况就不太一样了。

如果它真的是我的私人工作助理,我其实希望它知道更多。它最好知道我长期在做什么,知道我喜欢什么输出风格,知道我怕什么风险,知道我每次查数据都会忘记时间范围,知道我写 newsletter 时经常漏掉几个固定项目。

这些不是隐私八卦,不是它需要知道我中午吃了什么。这些是工作上下文。

问题是,今天我还是主要靠打字和说话来指挥它。也就是说,我用一个很窄的水管,去喂一个理论上可以吞下巨大上下文的系统。

这个画面很荒诞。像买了一辆货车,结果用奶茶吸管给它加油。加半天,还洒一身。

想到这里,我突然理解了《三体》里的三体人。他们思维透明,想什么别人都知道。这个设定放在人类社会当然很可怕。毕竟大多数人每天能正常上班,靠的就是脑子里那点没说出来的话。

但从沟通效率上讲,三体人确实让人羡慕。他们不用解释那么多。我们需要。

我们为什么会误解,因为每个人只能看到对方说出来的那一点点。我们为什么反复确认,因为真正关键的背景经常藏在没说出来的地方。我们为什么会返工,因为有些默认条件在脑子里很嚣张,到了嘴边却突然请假。

语言很伟大,但语言也很笨。它把一团同时发生的思维,压缩成一句一句的话。压缩就会丢东西。丢掉的可能是时间范围,可能是判断标准,可能是一个非常关键但本人以为这还用说吗的默认偏好。

然后 AI 就真的不知道。它不知道的时候,我们还会失望。人类真是很会为难机器。

一个很自然的反应是,那我是不是把 prompt 写长一点就好了。每次都把目标、背景、限制、输出格式、示例、反例、语气、禁区全部写进去。

这当然有用,但也很累。

如果每次下任务都要写得像交代后事,那我可能还没等 AI 提升效率,自己先被 prompt 消耗完了。

更重要的是,更长的 prompt 仍然没有解决根本问题。它只是把一句话变成了一篇小作文。它还是线性的,还是依赖我当下能不能想起来。问题是,我这个人当下能想起来的东西,非常不稳定。

我经常在发送之后,才进入人生最清醒的状态。发出去前,大脑一片祥和。发出去后,灵感喷涌而出。这时候再补一句哦对了,已经晚了。

所以我现在觉得,真正该做的,不是把 prompt 越写越长,而是把那些反复出现的隐含上下文沉淀下来。

不要每次都靠我这个不靠谱的人临场发挥。

比如取数据这件事,时间范围就应该变成一个默认要确认的字段。只要我没说,Agent 就应该问一句,是看最近两周,还是其他区间。它不应该假装我很完整,因为我通常没有那么完整。

再比如写 newsletter,有几个项目是默认必须覆盖的,有些内容要分清进展和风险,有些信息适合对外说,有些只能内部看。这些东西如果每次都靠我临时想起来,那就跟每天早上出门前重新学习怎么穿衣服差不多。

理论上可以。但没有必要。

这就不是 prompt 技巧的问题了。这是工作场景的问题。

我最近用 LLM-Wiki 做认知整理。它原本更像个人知识系统,把想法记下来,归类,提炼,再慢慢长成自己的认知结构。但如果把它放到 Agent 协作里,我觉得它可以变成一套默认上下文系统。

不是让它帮我写一个万能 checklist。万能 checklist 这种东西,听起来很专业,用起来很感人,最后常常躺在某个文档里安详离世。人类对清单的热爱,很多时候停留在创建清单那一刻。创建完以后,就算它完成了历史使命。

真正有用的,是把工作场景拆出来。

取数据是一个场景。这个场景里,Agent 默认要确认时间范围、数据来源、筛选条件、输出格式。

写 newsletter 是一个场景。这个场景里,Agent 默认要检查项目覆盖,要区分进展和风险,要判断哪些话能对外说,哪些话只是内部记录。

做分析也是一个场景。这个场景里,Agent 应该先问清楚读者是谁,是给我自己看,给团队看,还是给老板看。因为同一个结论,给不同人看,写法完全不一样。给自己看可以潦草一点,给老板看就不能写我感觉好像有点不太对。

这样一来,我的一句帮我看一下这类数据,就不再只是一句孤零零的话。它背后会自动展开一套上下文,默认时间范围要确认,默认筛选条件要明确,默认输出先给结论,再给查询逻辑,默认遇到数据异常,不要先写三页分析,先告诉我哪里不对。

这才是我理解的高带宽沟通。不是每次多说一点废话,而是让一句话能调用更多已经存在的背景。

如果再往前想一步,未来 Agent 和 Agent 之间,大概率不会一直说人话。

人类语言适合人类。它有弹性,有情绪,有暗示,有余地。比如你看着办吧,这句话在人类世界里很常见,听上去还挺信任。实际上它可能包含了我懒得说、我也不知道、你别搞砸、搞砸了我再说你四层意思。

机器之间没必要受这个罪。Agent 和 Agent 如果要交接任务、同步状态、共享约束、传递风险,完全可以用更结构化的方式。也许像 API,也许像任务状态机,也许像知识图谱加执行计划。

它们传递的可能不是帮我查一下这个,而是一个完整任务包。里面有目标、权限、上下文、检查点、失败条件,还有不确定时应该问谁。

听起来很没人味。但工作里有些环节,没人味反而是优点。尤其是那些反复发生、反复遗漏、反复返工的事。它们不需要一句温柔的你看着办,它们需要一条冷酷的必须确认时间范围。

那么今天我能做什么。今天能做的事其实很简单,把高频工作场景记下来。

看看哪些地方总是返工,哪些条件总是忘说,哪些偏好总是事后补充。每一次叫停 Agent,每一次哦对了,都不要只当成一次尴尬。

那是一个隐含上下文冒头了。它冒头一次,就把它按回流程里。

数据查询默认问时间范围。newsletter 默认检查项目覆盖。分析任务默认确认输出对象和判断标准。写作任务默认问语气、读者和是否保留原结构。

这些规则单独看都很小,小到不像什么高级方法论。但人的工作系统,就是被这些小东西拖慢的。我们不是每次都败给一个惊天动地的大错误。更多时候,我们败给一句忘说的话,一个没确认的条件,一个我以为你懂但其实谁也不懂的默认前提。

人类沟通的带宽可能天然就低。我们说话慢,写字慢,想得很多,说出来很少。脑子像一个仓库,门口却只有一个快递驿站的小窗口。里面堆得再满,外面也只能一件一件取。

Agent 的价值,也许不只是替我们干活。

它还可以帮我们整理这个仓库。把常用的放前面,把危险的贴标签,把每次都会忘的东西写进流程里。以后我们再开口,就不用临时在脑子里翻箱倒柜,翻到最后还对 AI 说,哦对了。

那一刻,至少我们能少丢一点脸,也少返一点工。

未来 Agent 和 Agent 之间也许会有一套人类看不懂的沟通协议。它们安静地交换任务包,安静地检查失败条件,安静地把事情做完。人类站在旁边,看不懂,但可能会很欣慰。

#ai #agent #llmwiki #工作流

This post is licensed under CC BY 4.0 by the author.

Recent Update

    Trending Tags

    Contents

    Trending Tags