新闻发布
立即打印
媒体联络
田园
用友集团 +86 1521 0340 959 tianyuanh@yonyou.com
企业服务大模型落地的统一入口:智能大搜
2024年6月11日



本文首次发布于《企业家》杂志2024年3月刊

作者:用友iuap数据中台专家 姚春雷


今年两会期间,“人工智能+”首次被写入政府工作报告。随着人工智能在企业的深化应用,无论是ChatGPT的诞生,还是Sora的横空出世,大模型在丰富人工智能的应用场景中起到重要作用。当前,企业对大模型的讨论也不再局限于技术本身,而是更加关注大模型可以在哪些场景真正落地?如何通过大模型赋能千行百业,从而为人类、企业以及社会的高质量发展创造价值。


1

企业应用大模型的难题:

私有化部署


从大模型的能力来看,其具备记忆、推理、逻辑理解、内容生成、代码生成等多项能力,包括现在多模态的发展,所以大模型在很大程度上能完成很多复杂的任务。企业对于数据的安全性要求较高,对于企业而言私有化部署是企业在大模型应用时的优先选择。但是私有部署,对于软硬件设备、技术开发能力等有很高的要求。


其一,计算资源需求大。大模型的训推需要大量的计算资源,如高性能计算机、大规模集群和云计算平台等。


其二,存储空间大。大模型参数越大所需要的数据量就越大,这也意味着需要具备先进的数据处理和存储技术。


其三,持续学习问题。大模型是基于资料自我学习后再把信息进行整合、加工,传递给用户。大模型只有不断的学习,才能满足企业即时搜索的需要。这样大模型中的数据量会越来越大,计算过程越来越复杂,所以对大模型的运算能力和运算时间提出更高要求。


其四,复杂场景的落地成本高。企业复杂的业务场景对模型的参数要求越高,随之成本越高。


用友企业服务大模型YonGPT,考虑落地过程中成本高、落地难等问题,对大模型进行了裁剪,也就是模型压缩。压缩以后,硬件和软件方面的成本都可以降到企业可接受的范围。这一步完成后,软硬件的成本解决了,但想让大模型真正落地,最重要的就是场景。


2

大模型落地企业

场景的便捷入口:

智能大搜


用友在服务企业客户时发现,大部分企业尤其是庞大的组织中的非结构化数据量是非常大的,寻找文档、人、图片、视频等内容的过程非常复杂。


其一,很难鉴定“搜”和“答”的边界。比如,我们平时用百度或谷歌搜索,通常是搜索具体的关键词,搜索和问答很难鉴定是因为搜索有时候无形地伴随着问答。比如“智能大搜是一款什么样的产品?”这是一个问题,但它也可能是搜索“智能大搜”的关键词,所以我们在搜索中很难鉴定到底是问还是搜。这就要求我们要对整个关键词进行很好的语义理解,把关键词提取出来进行相关的搜索。


其二,海量数据需要持续运营。上面提到大模型需要不断学习,那就需要把企业海量的数据进行处理,其次是标注、标签,更重要,还需要知识的运营。比如企业如何构建知识库,如何让知识库里的知识快速满足不同角色不同场景下的搜索需要。


用友作为一个大型企业同样遇到这些问题。因此用友从2014年开始在解决自身企业搜索问题的同时,于2023年结合大模型底座YonGPT正式推出了智能大搜,为企业提供AI大模型驱动的新一代搜索引擎,让知识赋能业务和组织。


智能大搜的出现,一方面让企业大模型的落地有了便捷的入口;另外企业对资料的持续迭代,在大模型的作用下,解决了即时搜索的难题;同时,智能大搜也是企业大模型在搜索能力上的增强应用,为企业搜索提升了人性化的体验,也降低了大模型的落地成本难题。


 


3

智能大搜应用场景:

智搜、智问、智推


智能大搜的主要目的是解决企业构建知识库的问题。通过搜文档、搜视频等功能,用友智能大搜能够迅速定位所需内容,帮助企业提升知识获取效率、降低学习成本。


目前国内市场上,智能搜索相关产品非常多,但大多数产品的核心能力是语言型的搜索能力,YonGPT智能大搜具备多模态的搜索能力,可以支持文档搜索、图片搜索、视频搜索、图谱搜索等,同时也可以绑定工作流来根据需要进行配置;智能大搜是多级门户的设计,企业可以通过不同组织、不同角色来定义不同的搜索门户;智能大搜支持门户的运营分析。包括有多少文件数量、文件类型、文件空间、图片数量等,包括一级节点数、二级节点数、搜索关键词排名、用户排名、命中率排名、失败率排名等。企业在大模型管理方面,可以默认使用用友YonGPT,也可以配置文心一言、通义千问、智谱等模型,甚至匹配自己的模型;支持资源库的创建、修改、编辑等。包括文件批量上传、单文件的上传、自动分词,包括按照分词处理,按照分词以外的处理。也包括把分词部分内容退给GPT,作为GPT的学习入口、数据入口,同时也支持PDF、DOC等多种文档类型。并且用友的智能大搜完全支持私有化部署。


用友智能大搜可以为企业带来智搜、智答、智推三方面价值,基于用户画像猜用户所想,推用户所需,助力企业内部资源高效应用。


 


一、智搜:智能大搜基于用友企业服务大模型YonGPT,提供“沉浸式”搜索新体验,低成本接入,聚焦企业各类搜索场景,帮助员工快速、准确获取所需知识。


具体到某些特定的场景,比如搜索时具备修正词的能力。诸如法律、金融医疗行业通常有大量专业名词,信息名称在输错的情况下,能否精准命中,考验的就是修正词的能力,所以用友智能大搜构建了修正词的能力,用户也可以根据自己的需求构建自有的修正词库,同时还支持一些知识图谱、资源标注、资源权限的控制能力。


以医疗行业为例,比如输入“复方甘草片”,其中方是方块的“方”,不是芳草的“芳”。但是如果我们输入错了,大模型是不能精准判断的。但是在大模型底层命中的时候,它会直接替换成正确的词去查询,也就是说即使你输入的词是错误,但依然能查到正确的结果。


经调查发现,医疗行业每人每天上百次查询的错误率高达60%,用了修正词库功能后正确率确实提高了很多。


再如权限功能,即支持多级的搜索门户和权限搭配。大部分搜索引擎中是不会划分权限的,但一般企业是非常严肃的企业。比如政府,文件分为公开、机密、保密文件,不同文件需要匹配不同的角色。所以用友智能大搜在搭建搜索门户时,绑定了有权限的资源库,进行角色分配,即不同的角色可以访问相对权限的搜索门户,不是所有角色都能访问统一的门户。


在这种情况下,如果我们给每个门户分配多个权限非常繁琐,所以我们把资源和门户绑定过以后,用户在搜索时会携带用户信息进入到搜索层,根据用户信息来决定你能访问哪个资源库的权限,从而解决典型的权限问题,也大大降低了配置的工作量。


以政府搜索门户为例,普通科员搜索的一般是公开文件,市委书记或者更高层领导一般是能看到保密或机密文件的,在这种情况下智能大搜会自然无感的给你做权限划分。也就是说你在搜索的时候,普通科员根本搜索不到机密文件,模型也不会把机密文件输出来。


二、智答:强大的语义理解和分析能力,挖掘企业沉淀的领域/行业知识宝藏,提供高质量的多模态知识问答,降低学习成本,提升工作效率。


智能大搜的一大挑战是很难解决“搜”和“问”的边界,所以智能大搜把“搜”和“问”做了模糊处理,可以为用户提供匹配真实需求的答案


比如我们问“张三是谁?”在正常搜索中一般会搜“张三”两个字,但这个提问后面多了一个“是谁”,如果我们把这四个字整体作为一个语义理解的时候会比较麻烦,到底是在问张三,还是问后面是谁?如果仅仅问张三,搜索张三的关键词,和张三相关的内容都会出来。但是你要问是谁?更多是要找他的简历及关的介绍。所以智能大搜把“搜”和“问”进行了模糊处理,也就是说不管输入“张三”还是“张三是谁?”,他都能精准的理解用户的意图,整个过程不需要用户自己做特别的界定。


三、智推:基于用户画像,猜用户所想,推用户所需,助力企业内部资源高效应用。


智推功能,可以理解为推荐的功能。在整个搜索过程中,智能大搜推荐的是用知识图谱感知用户的理解后输出的内容。比如搜索“微服务宕机了怎么办?”除了给你推荐解决微服务宕机的解法,还会推荐和微服务宕机相关的其他内容,这就是它的推理能力。


用友智能大搜已经在企业得到成功应用,比如致力于采购与招标领域深圳市远东数智采技术服务有限公司。远东数智采基于YonGPT,实现对海量标书进行智能化搜索和快速智能撰写标书。其中通过用友智能大搜,远东数智采构建了新的大模型搜索门户,为每个用户提供快速的文档检索能力,并且提供问答式的检索,在日常生活中我们很难定义什么是搜索,什么是问答,新的大模型搜索有效的将这两块的界限消除,使得平台使用者能有效的获得需要的内容,我们在问答式检索中同时为用户提供知识图谱的能力,问答内容的相关性以及与之有关系的内容也会以图谱的方式进行呈现。


从实践来看,单一大模型很难在企业落地。智能大搜是适合全行业,企业全角色的一套工具,让大模型在企业的应用中找到了落地点。而且针对不同行业不同用户需求,智能大搜还可以支持定制化应用。因此未来智能大搜一定会成为企业级大模型的前端能力,为大模型在企业的落地提供了统一的且便捷的入口,通过人工智能+提升企业新质生产力,实现高质量发展!