首页 > 科技资讯 > 正文

讯飞星火认知大模型体验测评:国产大模型领域的“排头兵”

        【每日科技网】

  这个春天里,“国产大模型”正在狂飙突进。

  相关数据显示,国内已发布的大模型达到了20余个,从百度、阿里等互联网大厂,到复旦、清华这些高校,都纷纷入局该领域。

  作为“人工智能国家队”,科大讯飞自然也不甘落后。

  4月20日,科大讯飞官宣,“星火”认知大模型将于5月6日正式发布,并在同日晚间的业绩说明会上,披露了“星火”的进展,引发业界极大关注。据悉,该模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等实用场景,通过海量文本、代码和知识学习,可实现基于自然对话方式的用户需求理解与任务执行。

  4月24日晚间,科大讯飞星火认知大模型官网正式上线,并已开放需求调研,填写企业、姓名、电话号码以及使用场景,便可以获取体验资格。

  “星火”上线,体验究竟如何?

  进入测试页面,首先映入眼帘的便是UI交互,风格十分简洁。在左下罗列着一些预设提问,如“为什么下水道的盖子是圆的”、“从1加到100等于多少”,左上则是对话任务窗口。

  我们首先提问了关于模型自身的问题。

  “讯飞星火认知大模型是什么?”

[MD:Title]

  “为什么要叫‘星火’?”

[MD:Title]

  总体上,“星火”对于自身的认识还是十分到位的,在回答名字由来时也是条理清晰。并且作为科大讯飞的大模型,表现出对于人工智能领域的期望。此外,在回复速度上,以中文显示时,“星火”表现得毫无迟滞感,十分顺畅。

  日常问题的解决,对普通用户十分重要,在这一方面,“星火”表现如何呢?我们问了以下问题。

  “如何做一份糖醋鲤鱼?”

[MD:Title]

  在菜谱之外,居家“生活妙招”也毫不含糊。

  “鞋子除臭有什么妙招?”

[MD:Title]

  在日常问题的处理中,“星火”可谓做到了“有始有终”,不仅列出了详细的步骤和方法,还“贴心”地附加了各种提醒,结构十分完整。

  在学习工作中,“星火”能否有所发挥呢?我们选择了最经典的翻译问题,以一本研究AI的英文书籍为例。

[MD:Title]

  “星火”游刃有余,翻译准确度比较高,而且较为简洁,在学习工作中充当“翻译助手”,显然不在话下。

  日常生活问题之外,测试“星火”的“IQ”,我们采用了最常用的脑筋急转弯。

  “小明的妈妈有四个孩子,前三个是小亮,小红,小丽,那第四个孩子叫什么呢?”

[MD:Title]

  推理能力不够的AI,经常会在这种问题上翻车,可“星火”的表现却令人惊喜,轻松给出了正确答案,完全没有被绕进去。尽管在后续测试中,面对“弱智”的问题和“地狱笑话”,“星火”也和很多AI一样败下阵来,但前面的表现依旧亮眼。

  IQ不错,那EQ呢?我们又选择了刁钻的两性难题

  “冷战时,对方拒绝沟通怎么办?”

[MD:Title]

  面对棘手的两性问题,“星火”的回答还是很合情合理的,能够围绕“沟通”给出十分具体实用的建议。在EQ方面也有着不错的表现。

  在笔者的体验中,“星火”总体表现可圈可点,尤其是在日常应用以及学习工作中,“星火”的表现十分稳定,作为国产大模型领域的“新军”,其潜力是十分巨大的。可以预见的是,5月6日“星火”大模型正式发布,无疑会给日常用户带来更加惊喜的体验。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.