ChatGPT可谓是生成式AI的突破,随即引爆了大规模预训练语言模型(以下简称大语言模型)在国内的高热度,但随技术供给及采纳方对技术理解的深入,其优势与缺点也愈加清晰。业内争议颇多,多方观点持续碰撞,但与此同时企业客户需求却颇为刚性,对技术落地应用的期待与呼声都不容忽视。
在技术高速发展的基础上,大语言模型在若干关键性能指标上的涌现能力,展现出了在节点上从量变到质变的实现过程。虽然大语言模型有很大的知识范围,也表现出了强大的知识理解能力和推理能力,但目前的局限也很明显。大语言模型通过预训练、强化学习、指令微调三个步骤的训练,不仅需要大量的语料和算力资源,训练成本极其高昂,并且由于“生成式模型”的本质,对问题的解答也有一定概率是不准确的,特别是对于专业领域内事实性答案,聚合的错误解答会误导实际判断与生产,产生不良后果。
先进技术集成,支撑产业智能更快落地
基于此现状,创跑网络知识智能团队将大语言模型与知识库相结合,将知识库作为外部知识源进行引入,既能够实现简化大语言模型在微调过程中对数据和算力的高要求,又能在一定程度上减少训练数据中缺乏领域专业知识的问题,降低大语言模型对领域内业务不能深入理解所造成的负面影响。国双知识智能团队认为通过结合知识库,是在当下企业的算力基础水平之上,成为高效解决大语言模型缺乏事实知识、幻觉和可解释性等诸多问题的可行路径。反过来通过技术在产业内的深入应用也将更助益于行业知识库完善,让业务智能化应用具备更为强大的文本和语言理解能力。集成企业已有的行业、企业知识库,与大语言模型的自然语言理解能力进行互补和融合,实现更智能、更准确、更专业、更易于理解的知识成果,辅助和指导企业的管理决策、生产运行和办公运营等,形成企业智能化支撑底座。
创跑网络知识智能专家介绍说:“行业、企业知识库可以包含文本、结构化数据库、知识图谱等。系统平台接收到用户请求后,通过协调处理器调用大语言模型和知识库,二者展开交互,从知识库中获取相关业务及专业知识并返回到大语言模型,结合模型自身训练时获得的知识和交互能力返回相关答案到协调处理器,再经过安全处理模块进行处理后,最终执行指令及操作。”将两种技术充分融合,或许更加全能的人工智能、或者说更可落地的产业智能将更快速的得以实现。
以知识图谱技术为代表构建行业知识库,
赋能大模型高效应于产业
众所周知,知识图谱能以三元组的形式存储巨量事实,即 (头实体、关系、尾实体),因此知识图谱是一种结构化和决断性的知识表征形式,目前公开的例子包括 Wikidata、YAGO 和 NELL。知识图谱对多种应用而言都至关重要,因为其能提供准确、明确的知识,此外该项技术还具有很强的符号推理能力,能支撑生成可解释的结果,并能够随新知识的持续输入而动态演进。此外,结合行业专家来构建特定领域的知识图谱,更能具备提供精确可靠的特定领域知识的强大能力。随大语言模型高速发展,将大模型和知识图谱联合起来的可能性在技术一经推出即受到了创跑网络产品团队的高度关注,并积极规划引入,结合现有知识智能平台产品开展研发及实践。
创跑网络在知识图谱技术领域早已深耕多年,自2017年起始即从司法领域开始探索,用于对司法文书和案例的汇集和整理,在此期间打磨出了自然语言处理的若干工具集,包括标注、抽取等,并形成文书解析的平台。后来,这个平台经过了油气、政务领域大数据项目的锤炼,用以对生产数据(主要是数值数据)进行分析和处理,对知识图谱技术的应用得到完善。2021年,创跑网络知识智能相关人工智能技术实现平台化,落地于多个研究院及工业企业,平台本身及周边的工具集、解决方案及实施方法等都已趋于成熟。
与国内自主研发的大语言模型相结合,创跑网络知识智能团队在油气领域,通过构建油气领域的文本知识库,一方面提升了油气领域三元组知识抽取的效率和效果,降低了知识图谱构建的成本,另一方面也实现了油气领域的专业智能化写作。根据输入的提示词或需求描述,参考知识库中已有的相关知识,快速生成需求描述中的文档。经验证,其生成效果得以大幅提升。
而在航空领域,通过构建航司领域的运行手册知识库、航变信息结构化数据库、以及知识图谱,与大语言模型相结合。由大语言模型理解各类场景,识别意图,然后由知识库给出正确的答案,并由大语言模型进行组合输出,可快速实现航司领域异常事件智能处置功能、航变方案信息智能生成等功能。
产业智能平台化,多元技术需要融合发展
创跑网络知识智能团队开放融合先进技术,快速推出大语言模型和知识图谱的融合技术方案,并将大语言模型的能力纳入知识智能平台产品功能,不可谓不是再一次卓有成效的创新实践。历经多轮研究验证,结合行业知识库可有效补充大语言模型训练阶段不包含的专业领域内的专业知识,并快速实现知识的结合与利用。将两种技术的优点进行融合,让它们在知识表征和推理方面的能力得以互相促进,将重构多样化的业务应用,例如知识检索、办公辅助、数字员工、智能客服、产品推广、智能巡检等,为企业应用赋予更富有人类知识、智慧和情感的智库,优化以往对话式AI的产品痛点,提升用户交互体验,减少用户工作强度和难度,支撑企业客户开展业务模式创新,同时也可为产业智能化应用的落地提供可靠的实现路径。
作为中国企业级数智平台软件厂商,创跑网络将积极拥抱人工智能技术的全新成果,针对客户的具体业务场景需求,以企业自身的高价值业务问题作为切入点,实现规模化、安全可控的产业智能规模化落地,成为组织的数字化、智能化转型中值得信赖的合作伙伴。
创跑网络知识智能平台由创跑网络科技自主研发,依托NLP、知识图谱、机器学习、深度学习等技术能力,形成模型构建、数据标注、知识抽取、知识计算和应用的完整工具链,实现“数据->知识->应用->优化”的一站式全生命周期管理,加速知识“收集->沉淀->共享->创新”。创跑网络知识智能平台包括知识管理台、知识加工台、算法开发台、智能搜索、智能推荐、智能问答、图谱可视分析、智能文档库八大子系统。已服务于油气、制造、大交通、电网、司法、政府等领域。