Skip to content

Commit 80e3571

Browse files
authored
Update 20230420_01.md
1 parent ac638e3 commit 80e3571

File tree

1 file changed

+14
-0
lines changed

1 file changed

+14
-0
lines changed

202304/20230420_01.md

+14
Original file line numberDiff line numberDiff line change
@@ -19,6 +19,20 @@ PostgreSQL , PolarDB , 手段 , 目的 , 数字
1919
出发太久, 忘了为什么出发? (十字军东征的故事.) 手段执行太久, 忘了什么是目的?
2020

2121
[《德说-第221期, AI崛起下的成人技能培训行业变革思考?》](../202304/20230418_03.md) 这一期也提到了这个问题.
22+
23+
大模型也会因为 “出发太久, 忘记初心” , 如下:
24+
25+
https://edu.aliyun.com/course/3126500/lesson/342570389
26+
27+
避免向大模型输入巨量信息
28+
29+
大模型仅支持有限长度的上下文,有人认为如果我们使用支持超长文本的大模型,我们就可以在使用时提供更多信息了。但是由于技术发展,我们越来越需要将历史信息、详细指令、API调用上下文、插件和系统响应信息等大量信息同时塞给大模型,这样做除了产生更大的调用成本和带宽消耗之外,还有可能降低有用信息被检索和解读的概率,导致大模型输出结果与用户的问题无关。因此,支持超长文本的大模型并没有给应用市场带来革命性的变化。所以,我们需要考虑优化提示词文字,精简信息内容,甚至压缩历史记忆文字量,从而提升大模型的准确率。
30+
31+
<b> 如果我们使用支持超长上下文的大模型,我们有可能会遇到另一个问题,对近邻信息敏感度更高的问题(recency问题)。也就是说,虽然我们可以给大模型传递很长的历史记录,但是大模型只对靠近提示词末尾部分的信息更感兴趣,如果你需要检索的信息恰好被编辑到提示词最开始的部分,大模型也有可能无法向你提供正确的答案。 </b>
32+
33+
持续优化Agent规划能力
34+
35+
与人类相比,大模型Agent的规划能力还比较初级。大模型是从训练样本中学习事物之间的联系,并学会如何做规划的。在实际应用中,大模型做出的规划很可能需要先经过使用者的调整再做实施。在面对一个复杂任务时,大模型Agent会将任务分解为一系列长链路的步骤,我们可以设计一些方法衡量这些步骤是否还需要进一步拆解。当大模型按照步骤链条执行时,我们也需要设计自动化方案,观察执行链路中会不会出现前一个步骤累积下来的错误,执行过程是否需要终止。当然,我们也可以添加交互手段,让系统的使用者介入Agent的规划和执行,加以修正。
2236

2337
## 分清手段和目的, 以及对应的数字
2438
1、分清手段和目的

0 commit comments

Comments
 (0)