
袁鸣:我前一阵采访一位著名的表演艺术家,我要跟她做一个对谈。我去搜查资料、找资料,它就说她演过什么戏。结果在现场,我就特别诚恳地跟她说:“您演的这个戏怎么样,那个戏怎么样?”然后她说:“我没演过这些戏。”当场你知道吗?那种窘迫,我就觉得特别不好意思。但是我是那么地信任它,我哪知道它还真的就骗我了。 陈小平:这其实说明一个问题,就是有了新的人工智能,传统的技术未必就是完全过时。比如说我们如果用人工智能、用大模型做了一些检索,它有可能很快告诉你一个结果。我们验证的时候,还是需要用传统的搜索引擎去找原始资料,看能不能找着。找着了,你核对一下,核对正确就没问题了;如果找不着,那可能就是出错了。 袁鸣:为什么?这我就很好奇。 陈小平:比如说,你问它某一个人的代表作,我们想的是那个人,我先要把那个人定位了。但是它其实就认的是那个人的名字,所以它可能和另外一个同名的人可以混淆。而且呢,它甚至说那个名字比较像的,它都有可能混淆。它有一个特殊的机制:它不是每次都回答它认为最可靠的答案,不是的,它故意会以一定的概率选一些不太可靠的答案。 为什么这样?如果每次都选最可靠的,它说话就很啰嗦。所以它就有这么一个机制,它有一个叫温度的超参数。 袁鸣:温度,就是我们知道的那个温度? 陈小平:那个温度参数值不同的时候,它的关联范围会放大,可靠性降低,但这样说出话会很有意思。所以这种机制在聊天的时候就特别好。聊天,有时候聊到你没想到的,甚至话题都跑了,但是你觉得很有意思。 袁鸣:有意思。您能不能够给我们比较简单地解释一下,我们怎么才能用好它,别被它骗? 陈小平:大模型通过训练到底学会了什么?它学会的不是那些数学公式,它学会的是一些例子。这个例子是天量的,不是海量,比海量还要多。这些例子里有的是对的,有的是不对的。 袁鸣:它在学的时候,其实它也不知道这些例子对不对。 陈小平:它没办法知道。 袁鸣:它并没有做这个判断。 陈小平:现在人工智能是没有办法判断,数据本身可能有错。另外数据实际上是远远不够的,所以需要靠算法赋值。算法赋值就有很多人为的因素,人觉得我这样赋值是合理的,但是人的这种判断如果没有理论的支持,它不保证人的判断永远是对的。这样就传递给大模型了,就会有些错误的东西传进去了。 袁鸣:以讹传讹了。#知识前沿派对 #人工智能 #大模型 #幻觉 #温度