中邮信科公司举办ChatGPT等AIGC技术与应用学术交流会
2023-04-12

  3月31日,中邮信科公司组织开展了“ChatGPT等AIGC(AI Generated Content)技术与应用”学术交流会。本次学术活动邀请业界知名技术专家,分别以“大模型技术解析及应用展望”“大模型驱动AI产业应用加速发展”为题,进行了深入浅出的大模型技术原理剖析,展开了生动活泼的产业发展探讨交流。本次活动由中邮信科公司邮政应用部具体承办,来自集团公司总部各部门、各直属单位、各控股公司及部分省公司的300多位技术、业务专家参加研讨。

  ChatGPT及生成式模型

  2022年11月,OpenAI发布的ChatGPT(Chat Generative Pre-Trained Transformer)通用对话系统,是一种聊天类生成式预训练大模型,具有海量信息的参数化全量记忆、任意任务的对话式理解、复杂逻辑的思维链推理、多角色多风格长文本生成等特点。ChatGPT所能实现的人类意图,来源于机器学习、神经网络以及Transformer模型的多种技术模型积累。ChatGPT是一种生成模型,回顾人工智能发展中常见的生成模型有自回归模型、GAN、VAE、Flow-based models、Diffusion models等。面向认知的Transformer模型从自回归模型演化,特别适合做序列预测,是认知智能主流路线,又叫做大语言模型,具有适合大训练集、高并行、推广性好等特点。Transformer的两大主要变体是BERT和GPT,BERT是双向编码模型,在无监督训练中,盖住一个或多个词,根据上下文预测这个词,由于见过下文,不适用于生成式任务;GPT是单向语言模型,在无监督训练过程中,由前面的词(上文)预测后面的词,适用于生成式任务。

  构建大模型需要跨越的鸿沟

  根据专家介绍,构建大模型应用需要多方面的准备和投入。一是数据方面:在保障数据安全、用户隐私等符合国家法律法规和政策的前提下,进一步挖掘、收集及清洗高质量、多领域、多行业及多样性的海量丰富数据,辅以技术和人工结合的高质量清洗工作,并持续通过人工标注反馈强化学习,使得模型生成结果更加可控、合理及可靠,知识符合道德伦理、法规要求。二是算力方面:超大模型的训练需要大规模计算集群及对应的模型并行算法框架的支撑,1000张主流卡的独立计算集群是完成该类任务的门槛之一。三是工程实现:由于大模型在推理阶段仍然需要巨大算力消耗(以对话交互为例,目前单次交互成本大致是主流方法的1000倍左右),如何将大模型部署在线上,以供大规模用户快速的、经济化地使用,也是需要关注的。

  大模型产业应用发展

  科大讯飞在2022年12月15日已启动了“1+N认知智能大模型技术及应用”攻关,结合实验室在深度学习、行业大数据、知识图谱、工程技术和行业应用等优势,目标是中文认知智能达到国际领先和经济实用,加速完成教育、医疗、交互等领域的国家任务。百度的文心大模型定位为产业级增强大模型,参数量达到2600亿,形成了大模型、平台工具、社区产品的三层架构,涵盖了NLP大模型、CV大模型、跨模态大模型、生物计算大模型以及行业大模型,并已于近期发布了面向公众的“文心一言”应用。另外,近期行业内也涌现了众多大模型的创新研究与实践。

  本次学术交流活动紧紧抓住人工智能产业发展的新方向、新趋势,加深了广大参会人员对当前生成式AI、大模型等主流人工智能技术的了解认识,为相关技术在业务中实践、落地进行铺垫和准备,受到了与会人员的好评。

  生成式对话AI技术在智能客服领域具有较大应用潜力,中邮信科公司作为本次学术交流的承办方,将继续跟踪技术发展的前沿情况,继续探索生成式AI技术在邮政业务中的落地应用。