5月6日,讯飞星火认知大模型成果发布会在安徽合肥举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实机测试大模型七大核心能力。
创意和灵感变成产业福利
(相关资料图)
“传统意义上依赖于时长和人力的商业模式将被根本性的颠覆,因此有人说,这一次人工智能在历史上的意义不亚于PC和互联网的诞生,我觉得这是完全恰当的一种表述。”刘庆峰说,这一次的认知大模型的主要特点,是多种类型的数据送到一个统一的认知智能大模型中学习和训练,最终可以在通用领域给大家非常惊喜的能力表现。
各种类型的文本可以是多种来源的,也可以是文字、语音、图像或者是视频等多种风格。关键问题是,通过统一的大模型学习之后,系统具备了像人类一样触类旁通的能力,在多领域的智慧涌现令人惊喜。
刘庆峰说,这一波的认知大模型,已经实实在在开启了通用人工智能的曙光。通用人工智能令人关注的七大维度,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。通过这七方面能力提升,将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。
他举例说,它将会改变当前的信息分发和获取的模式。要想获得相关信息直接跟它提问,它会给精准答案甚至是融合多种相关结果,触类旁通以后出来的一种答案,不再需要人们自己搜索。
它可以革新内容生产方式,不仅可以帮写发言稿、邮件,还可以写广告文案的创意、调研报告,人只要做简单检查,最后画龙点睛加工。
“在未来信息产业、数字经济中,人人都可能会创业,他的创意和灵感将更多变成产业福利,将会带来整个产业生态重大的变革和重塑。”刘庆峰说。
星火大模型能做到情感分析
发布会上,刘庆峰展示了讯飞星火大模型发展现状,以及下一步的落地情况。他表示,2022年12月,科大讯飞启动“1+N”认知大模型的专项攻关。“1”是专用的认知大模型——星火认知大模型。“N”就是大模型在各个领域的落地,从教育、医疗、汽车、办公等等。
多风格、多任务的长文本生成能力方面,星火大模型可以帮助写发言稿、邮件、新闻通稿、营销方案等;语言理解能力方面,可以做到最细微的关于每个单词和语法、时态等等检查,甚至能够做到情感分析。
星火大模型中,目前还只把讯飞医疗专业系统中的一部分通用能力放上来,这是考虑到医疗要更加严肃、更加谨慎,同时也面临很多医疗相关法规,但刘庆峰表示,讯飞智医助理不仅比现在Chat GPT的医疗能力强,比Chat GPT4.0也要强很多。下一步会把这些专业能力与医疗机构合作,成为医生的诊疗助理。
与数学相关的16个类别详细任务中,讯飞模型在国内可测的同类系统中遥遥领先,甚至超过了Chat GPT。
代码能力方面,不仅可以生成也可以修改代码,理解和编译等等;不过,刘庆峰坦言,代码能力处于刚起步阶段,与Chat GPT相比还有很大差距,未来2、3个月会有非常大提升。
大模型存在一定技术缺陷
刘庆峰也谈到,纯大模型技术还有待攻克的技术缺陷。由于它都是用历史的数据来进行训练,在海量的模型参数中记忆学习训练后,在通用领域实现智慧涌现和触类旁通。
由此可能带来的第一个问题是新知识难以更新。例如,“星火”模型是4月份才学的最新信息,但现在已经是5月了,如果问它“五一”劳动节全国前三天有多少旅客?星火只能说去年的,Chat GPT会说到前年,因为训练的语料内容不同。
同样也是因为这个原因,在事实类的问题中容易张冠李戴,把唐朝第二位皇帝李世民说成第三个,Chat GPT也是这样。对于历史比如说名著,它也会有一些编造添油加醋的地方。
针对这些问题,刘庆峰谈到,计划要升级几个版本,6月9日(科大讯飞24周年庆),将突破开放式问答(即实时问答),不是简单搜索。
到8月15日,代码能力会上一个大台阶;10月24日(科大讯飞全球开发者节),星火有望在通用认知大模型能力上对标Chat GPT,科学、系统的评测方法,在中文上要超越Chat GPT,在英文上要达到相当水平。
刘庆峰提到,在中英文的文本生成能力,如果5分是满分,ChatGPT是4.48分,讯飞的星火模型已经是4.29分了。
(文章来源:南方Plus)