中国科学院院士张钹：大语言模型“三大能力”与“一大缺陷”不容忽视

新闻发布

立即打印

媒体联络

田园

用友集团 +86 1521 0340 959 tianyuanh@yonyou.com

中国科学院院士张钹：大语言模型“三大能力”与“一大缺陷”不容忽视

2024年8月20日

在当今技术迅速发展的时代，生成式人工智能与大模型正成为推动产业变革的重要力量。随着AI技术的不断成熟与普及，它的应用已从个人领域扩展至企业层面，广泛覆盖各行各业。

那么，新技术究竟会给产业带来哪些积极影响？它又将如何平稳落地到场景？近日，在用友主办的“2024全球商业创新大会”上，中国科学院院士、清华大学人工智能研究院名誉院长张钹发表了主题为《生成式人工智能时代的产业》的演讲。

会上，张钹院士从能力、应用、架构、趋势等几个维度，详尽阐述了学术界关于大模型的洞察与思考，全面剖析了大模型的演进路径，就该技术的应用前景、挑战及其在不同领域的实际应用展开了深入探讨。

大语言模型“三大能力”与“一大缺陷”不容忽视

会上，张钹院士探讨了生成式人工智能的核心优势及其可能带来的挑战。目前，在大模型发展的进程中，已呈现出“三大能力”和“一大缺陷”。

其中，生成式人工智能具备三大核心能力为：

第一、强大的语言生成能力，即在开领域生成多样性的、语义连贯的、类似人类的文本。这是大语言模型区别于其他计算机生成语言的灵魂和优势所在；

第二、强大的自然语言对话能力，即在开领域实现人机自然语言对话；

第三、强大的迁移能力，即在代理任务上训练一个模型，只需要少量数据和微调，就可以适配到下游任务中，从而凸显出大模型可举一反三的能力。

除了上述优势外，大模型也呈现了一大缺陷，那就是大模型的幻觉。换句话说，在多样性输出的过程中，大模型也会犯错，这与它的创造性同时产生。事实上，这种幻觉是外部信息驱动下产生的，因为大模型与人类生成的语言只是行为上相似，而内在机制完全不同。更深一步讲，这也揭示出了基础模型的局限性。一方面，它输出的结果不一定正确，且质量不可控；另一方面，大模型不可信任；还有一方面，大模型对提示词的依赖性强，鲁棒性较差。张钹院士表示，正因具备上述优势与缺陷，产业在落地大模型应用时必须格外重视这些因素。

第三代人工智能技术的发展关键点仍在于如何让它落地

随着生成式人工智能的快速发展，业界也对其未来前景提出了质疑。针对这一业界普遍关注的问题，张钹院士解释道，生成式AI是人类发展史上的一次重大技术突破。为此，人类花费了几十年时间解决了人工智能领域中的三个关键技术问题——文本的语义向量表示、生成式预训练转换器、自监督学习。

其中，最关键的技术创新就在于文本的语义向量表示，它实现了从信息形式的处理到信息内容处理的跨越。张钹院士表示，这项技术真正意义在于它将语言问题转变为一个数学问题。原来，文本仅代表了一个个符号，符号是存在于离散空间的，这些很难用数学工具去解析。而现在，语言被翻译为向量，计算机根据向量就可以解析成语义，对信息的内容加以处理，从而帮助人类真正进入到人工智能时代。

基于对大模型原理的深入理解，张钹院士对第三代人工智能技术的发展抱有十足的信心。就目前来看，问题的关键点仍在于如何让它落地。

张钹院士认为，第三代人工智能的发展方向重点在于：第一，构建具备可解释与鲁棒（稳健）的AI理论与方法，消除人们心里产生的恐慌。其次，开发安全、可控、可信、可靠且可扩展的技术，从而驱动人工智能产业的繁荣发展。第三，推动AI的创新应用与产业化。这表明，AI技术的研究与开发不仅仅是学术上的突破，还需要与产业需求紧密结合，将技术创新转化为现实应用，从而带来经济效益和社会进步。

同时，他还提出了“知识驱动 + 数据驱动”的理念，通过整合知识、数据、算法和算力这四大要素，确保AI技术不仅具备强大的智能能力，还能够在多样化的应用场景中发挥稳定且长效的作用。

基础模型的三种落地方向

目前，在生成式AI的众多应用场景中，高阶应用如设计、规划，低阶应用如服务、营销是相对容易实现的。例如，券商可依托大模型打造新一代AI中台大脑，帮助企业实现智能化的开户、客服、AI选股等服务场景。

与之相反，涉及企业关键业务领域的大模型应用场景则是较难实现的，如自动驾驶或制造行业的定制化生产、质量控制等。因为这些核心业务对于技术的容错率较低，而可靠性、准确性要求更高。

那么，大模型的应用场景该如何落地到核心业务领域？技术提供商、产业界的机会在哪里？

张钹院士提出了落地通用基础模型的三种方向。

第一，面向各个行业的垂类大模型；

第二，在大模型的基础上打造产业应用；

第三，让大模型与其他技术、工具相结合，创造产业应用。

找到了大模型的落地方向，那么让大模型真正落地，同时还能使其用起来安全、可信、可控，这是产业和企业普遍关注的话题。为此，张钹院士提出了基于大模型的六种架构模式，具体为提示工程、检索增强生成（RAG）、微调、知识图谱与向量数据库、内部监测与控制以及安全与治理。

在人工智能技术突飞猛进的今天，大模型正在各行各业中展现出巨大的潜力。张钹院士强调，坚持中国自主发展之路，必须认识到知识驱动与数据驱动在第三代人工智能中的核心作用，充分结合和利用知识、数据、算法、算力等要素，从而驱动中国人工智能产业的繁荣发展。

文/广州日报新花城记者：张露

图/广州日报新花城记者：张露

广州日报新花城编辑：李光曼

上一篇：用友全新定义“企业AI”，加速企业数智化

下一篇：用友网络AI“赶路”