ChatGPT在全球范围内爆火之后,国内也迎来了大模型热潮,从百度、阿里等互联网大厂,到复旦、清华等著名高校,都纷纷入局该领域,很多人都在关注“国产ChatGPT”的名号究竟花落谁家。然而,比名号更重要的是体验,毕竟相较于技术,这是用户最能直观感受到的,能够运用技术将体验提升到更新层次,才是用户需要的大模型。
(相关资料图)
6月9日,在科大讯飞24周年庆上,讯飞星火认知大模型发布了全新的V1.5版本,这是时隔一个月,星火认知大模型迎来的首次升级,其不仅在综合能力上实现三大升级,包括开放式知识问答、多轮对话、逻辑和数学能力,还一同带来了星火APP和小程序,推出纯语言对话、多模态输入、多终端支持、多功能小助手等重磅功能,进一步提升用户使用大模型的便捷性。开放内测后,我们也第一时间申请了试用,体验如何呢?一起来看看吧。
交互简单方便,多轮对话无压力
进入讯飞星火小程序首页,映入眼帘的UI交互风格非常简洁。并附有简短的“自我介绍”——能够学习和理解人类的语言,进行多轮对话,回答问题,高效帮助人们获取信息、知识和灵感。
下方则是一些预设提问,相当于一个范例。我们就索性用它推荐的问题来作为第一道“考题”,点击“关于生态发展,国内最近出台了哪些新政策”,星火认知大模型很快就给出了答案。
再接着提问,大学生毕业写求职简历应该注意些什么?可以看到回答的依然非常详实且迅速,在我紧接着提问“有相关模板吗”,也迅速给出了简历模板,进行多轮对话无压力。
紧接着,我们问题升级,都知道中华文化博大精深,那对于一些很有特色的“玩梗”,星火认知大模型又能否理解呢?
第一个问题:“有一种饿,叫妈妈觉得你饿”是什么意思?,这是典型的“中国式”的梗,很多外国的大语言模型产品都回答得不够好,星火认知大模型很快给出了准确且生动的答案。
第二个问题:“累觉不爱”、“十动然拒”、“yyds”是什么意思?依然回答流畅,对话无压力。
一番体验下来,相比同类型及前代产品,星火认知大模型V1.5版本显然是能快速理解用户需求的,并且对指令的能力也呈指数级上升,反馈速度同步升级,整体体验不俗。
200+场景助手,职场、生活、学习全覆盖
除此之外,更令人惊艳的是,此次星火APP上线了200+个场景助手,深入职场、生活、出行、写作等用户高频场景,不仅支持个性化定制,还支持创作发布和分享。助手功能可以在PC端创建,而其它终端可以直接使用,只要在对话框输入“@”就可以唤起专属助手。
比如,我们唤起学习助手,来考考它的逻辑和数学能力,输入题目:老师给全班60个人布置了两道作业题,其中40个人做对了第一道题,有31个人做对了第二道题,有4个人两道题都做错了,那么两道题都做对的有多少个?
可以看到,讯飞星火认知大模型的解题思路和我们一样,通过设方程式解答,给到了正确的答案。紧接着我们提高难度,再出题:两人做一种游戏,轮流报数,报出的数只能是 1, 2, 3, 4, 5, 6, 7, 8.把两人报出的数连加起来,谁报数后,加起来的数是 123,谁就获胜,让你先报,就一定会赢,那么你第一个数报几?
甲、乙、丙、丁四位学生在广场上踢足球,打碎了玻璃窗,有人问他们时,他们这样说:
甲:“玻璃是丙也可能是丁打碎的”;乙:“是丁打碎的”;
丙:“我没有打坏玻璃”;丁:“我才不干这种事”;
深深了解学生的老师说:“他们中有三位决不会说谎话”。那么,到底是谁打碎了玻璃?
显然,讯飞星火认知大模型是非常聪明的,面对逻辑推理题,也是有条不紊,在各种假设和推断后,精准地给出了问题的答案。
此外,我们知道科大讯飞一直说智能语音方面的佼佼者,在语音交互和转译方面有着不俗的实力,而我们日常不论是在工作还是生活中,都会遇到需要用外语交流或写作的情况,在自身实力不允许的情况下,只能求助于各种翻译APP,不仅麻烦还无法保证准确率。
星火认知大模型的小助手还提供了英文小词典、英文作文、中英互译小助手等,这里我们也测试了它的语言能力,写英文作文,中英互译都不在话下。其中,英文词典不仅提供单词释义,还会给出场景例句及相近词,进一步拓宽知识面。
同时,为了满足大学生、商务人士的口语陪练需求,讯飞将AI口语助手升级为了星火语伴APP,在大模型的加持下,可以进行开放式对话、情景交流,像口语老师一样陪练,甚至可以用视频对话的方式,与虚拟老师面对面沟通,这种沉浸式的体验将大大提高口语练习效率。
当然,大模型的作用绝对不仅限于学习,这里我们也测试了其他功能。比如出门旅行,最烦做攻略,选择“出行—旅游攻略助手”,一份详尽的攻略就做好了。
生活中,突发奇想要练练厨艺,准备菜单、找菜谱要花费很多时间,唤出“AI食神”,只要输入食材名称,就能生成烹饪步骤。
以及大模型必备的写作能力,以“端午节民俗活动”为主题写一个短视频脚本:
唤起“扩写助手”,给出关键词,就能扩写出完整的文案。
整体体验下来,星火认知大模型可以说是处于国内大语言模型产品的头部水平,不论是文本写作、多轮对话还是响应速度都堪称完美,尤其是在日常应用以及学习工作中,星火认知大模型的表现十分稳定,此次上线移动端更是加分不少,要知道目前的国产大模型产品基本都是网页版,使用起来多少还是有些不方便。
同时需要指出的是,这只是星火认知大模型的第一次升级,按照官方时间表,8月15日将进行第二轮升级,重点围绕代码能力与多模态交互能力升级,第三轮升级为10月24日,届时将实现英文相当的全面对标。毋庸置疑,作为国产大模型领域的排头兵,星火认知大模型的潜力是十分巨大的,期待它为用户带来更加惊喜的体验。