科大讯飞发布“星火”大模型 10月有望对标ChatGPT-焦点精选

南方Plus| 2023-05-07 21:09:17

5月6日，讯飞星火认知大模型成果发布会在安徽合肥举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型，现场实机测试大模型七大核心能力。

创意和灵感变成产业福利

(相关资料图)

“传统意义上依赖于时长和人力的商业模式将被根本性的颠覆，因此有人说，这一次人工智能在历史上的意义不亚于PC和互联网的诞生，我觉得这是完全恰当的一种表述。”刘庆峰说，这一次的认知大模型的主要特点，是多种类型的数据送到一个统一的认知智能大模型中学习和训练，最终可以在通用领域给大家非常惊喜的能力表现。

各种类型的文本可以是多种来源的，也可以是文字、语音、图像或者是视频等多种风格。关键问题是，通过统一的大模型学习之后，系统具备了像人类一样触类旁通的能力，在多领域的智慧涌现令人惊喜。

刘庆峰说，这一波的认知大模型，已经实实在在开启了通用人工智能的曙光。通用人工智能令人关注的七大维度，包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。通过这七方面能力提升，将对整个人类的生产和生活方式带来巨大的颠覆，产生全新的机会。

他举例说，它将会改变当前的信息分发和获取的模式。要想获得相关信息直接跟它提问，它会给精准答案甚至是融合多种相关结果，触类旁通以后出来的一种答案，不再需要人们自己搜索。

它可以革新内容生产方式，不仅可以帮写发言稿、邮件，还可以写广告文案的创意、调研报告，人只要做简单检查，最后画龙点睛加工。

“在未来信息产业、数字经济中，人人都可能会创业，他的创意和灵感将更多变成产业福利，将会带来整个产业生态重大的变革和重塑。”刘庆峰说。

星火大模型能做到情感分析

发布会上，刘庆峰展示了讯飞星火大模型发展现状，以及下一步的落地情况。他表示，2022年12月，科大讯飞启动“1+N”认知大模型的专项攻关。“1”是专用的认知大模型——星火认知大模型。“N”就是大模型在各个领域的落地，从教育、医疗、汽车、办公等等。

多风格、多任务的长文本生成能力方面，星火大模型可以帮助写发言稿、邮件、新闻通稿、营销方案等；语言理解能力方面，可以做到最细微的关于每个单词和语法、时态等等检查，甚至能够做到情感分析。

星火大模型中，目前还只把讯飞医疗专业系统中的一部分通用能力放上来，这是考虑到医疗要更加严肃、更加谨慎，同时也面临很多医疗相关法规，但刘庆峰表示，讯飞智医助理不仅比现在Chat GPT的医疗能力强，比Chat GPT4.0也要强很多。下一步会把这些专业能力与医疗机构合作，成为医生的诊疗助理。

与数学相关的16个类别详细任务中，讯飞模型在国内可测的同类系统中遥遥领先，甚至超过了Chat GPT。

代码能力方面，不仅可以生成也可以修改代码，理解和编译等等；不过，刘庆峰坦言，代码能力处于刚起步阶段，与Chat GPT相比还有很大差距，未来2、3个月会有非常大提升。

大模型存在一定技术缺陷

刘庆峰也谈到，纯大模型技术还有待攻克的技术缺陷。由于它都是用历史的数据来进行训练，在海量的模型参数中记忆学习训练后，在通用领域实现智慧涌现和触类旁通。

由此可能带来的第一个问题是新知识难以更新。例如，“星火”模型是4月份才学的最新信息，但现在已经是5月了，如果问它“五一”劳动节全国前三天有多少旅客？星火只能说去年的，Chat GPT会说到前年，因为训练的语料内容不同。

同样也是因为这个原因，在事实类的问题中容易张冠李戴，把唐朝第二位皇帝李世民说成第三个，Chat GPT也是这样。对于历史比如说名著，它也会有一些编造添油加醋的地方。

针对这些问题，刘庆峰谈到，计划要升级几个版本，6月9日（科大讯飞24周年庆），将突破开放式问答（即实时问答），不是简单搜索。

到8月15日，代码能力会上一个大台阶；10月24日（科大讯飞全球开发者节），星火有望在通用认知大模型能力上对标Chat GPT，科学、系统的评测方法，在中文上要超越Chat GPT，在英文上要达到相当水平。

刘庆峰提到，在中英文的文本生成能力，如果5分是满分，ChatGPT是4.48分，讯飞的星火模型已经是4.29分了。

（文章来源：南方Plus）