◎智谷趋势(ID:zgtrend) | 王延鹤
今年一季度,AI无疑是的热潮。
从去年11月30日,ChatGPT正式上线开始,不论国内国外的公司,都像找到了奔向“新世界”的船票,要么在研发AI,要么在业务+AI结合的路上。
彭博做了个图,展示标普500上市公司的财报里,提到AI的次数上升了77%。
微软的AI云一路大胜,英伟达的芯片供不应求,谷歌、亚马逊、Meta都将投资AI当成第一大事。
别问,问就是这次一定,这把all in。
中国A股市场更夸张,ChatGPT概念、AI板块,上百家公司变身大牛股。
AI成了最确定的确定性。
企业是否坚定拥抱AI,也成为市场一个重要参考指标。
过去50天,中国的科技公司、高校、研究机构已发布了30多款AI大模型产品。
谋局落子,各有千秋,平均每天至少有一个AI大新闻。不管是骡子是马,都先出来遛遛,把融资和市值都拉一把。
超60家厂商宣布研发大模型,像字节跳动、小米的大模型就还在路上。
5月6日,“AI国家队”科大讯飞,发布了 讯飞星火认知大模型 。
和30多个同行比起来,讯飞算是姗姗来迟,但搞的事情反而。
之前的AI大模型,发布现场都是放PPT,和提前录制好的Demo为主。 大部分人还得乖乖在waitlist排队,等一个内测资格,才能实际上手操作。
讯飞星火胆子很大,现场直接上真机实测,目前全国仅此一例,务实且有建设性。
不仅如此,星火一步到位,直接大规模开放测试。所有人都能上手体验,实际操作加深认知。
虽说发布会现场的演示也出现了一些小瑕疵,但瑕不掩瑜,承认差距,直视不足,一边跑步一边迭代。古书有云: 观敌之变动,后之发,先之至,此用兵之要术。
这样自信又务实的企业,都是有真本事做底气的。否则ChatGPT珠玉在前,一不小心画饼不成,反而不妥。
再者,用少数案例来证实大模型的好坏都是不实事求是的,科大讯飞做语音AI起家, 24年来一直是国内AI行业“学霸”一般的存在,在认知智能上浸润极深。
2011年,“语音及语言信息处理国家工程实验室”经国家发改委批复成立,由中国科大与科大讯飞股份有限公司联合共建。2017年,讯飞又获批承建了“认知智能国家重点实验室”,被业内戏称为“AI国家队”。
“1999年,中文语音市场全部被国际巨头控制,中国人被掐住了咽喉;我们创办科大讯飞,提出要让中国语音技术做到全世界,要在多语种技术上做到全世界第一。”
如今,24年过去,初心不改,信念终成现实。科大讯飞董事长刘庆峰在发布会上表示, 在10月底的升级后,星火将整体赶超ChatGPT。
实力是拼出来的,不是喊出来的。
大模型能力成色有几分,往往大家上手一试,就有直观体验。
但现在几十个大模型,都号称要和ChatGPT掰手腕。有人说自己只差2个月,有的人说想追上至少等明年。
要知道,OpenAI可不会原地踏步。虽然马斯克搞了万人联名,建议暂停大模型研发6个月,但各大科技公司的投入不减反增。
AI大模型是智能时代座的技术。
这不仅是几家巨头争市场,更是争未来的生存权、发展权。中国做大模型务必要以科学的体系来统筹,企业需用正面积极的态度做竞争,市场上部分抹黑、造谣的声音格局太小。拧成一股绳,不愁生产搞不上去。
那么问题来了: 国产大模型和ChatGPT的差距,到底还有多远?如何科学地去评估?
科大讯飞和认知智能全国重点实验室牵头,设计了统一、系统性的评判体系,覆盖7种能力,481个细分指标。
这7个维度的能力,包括:语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
刘庆峰更是表示, “在文本生成和数学能力(一定程度代表通用认知大模型的智慧水平)上,星火认知大模型已经国内显著,且相比ChatGPT也具有一定优势;在语言理解和知识问答方面也达到接近ChatGPT水平,处于国内水平。”
智谷之前就注册了讯飞星火,我们也从多个维度,体验了一把星火的能力。
我们首先考验了星火对当下时事的分析能力:
虽然星火没实时接入数据,但对淄博烧烤、特斯拉降价的分析角度很全面,可以为大家提供一个研究的大方向。
随后我们尝试用笑话和梗,看能否迷惑星火:
故事创作,我们让它续写《流浪地球3》的大纲。
星火针对不同平台特点加入emoji、话题标签,使文案更加风格化。
一般数学题根本难不住星火,不但给出正确答案,也给了完整的解题步骤。
也可以在几秒钟里,用Python写出计算鸡兔同笼问题的程序。
总体而言,星火在中文文本、数学能力上与ChatGPT 3.5媲美,不过距离GPT-4还有所差距,这个无需否认,出生就对标成熟的ChatGPT也为时过早。就目前国内大模型市场来看,星火实力名列前茅,响应速度也很快,诞生之初即是国内尖子生已经不容易。
并且,科大讯飞公布了时间表,在6月9日、8月15日、10月24日还会进行三次升级。在不断交替迭代中,一步步实现进化,进步空间还有很大。
1024,是2的10次方,也是计算机二进制的基本计量单位,具有特殊的意义。
1024之后赶超ChatGPT,值得我们期待一把。现在OpenAI一骑在前,给所有追赶者,留下了大致的追赶路线。
算法、算力、数据,这是AI版三驾马车。
GPT-3规模是1750亿浮点参数,GPT-4规模没公布,但大家估算在5000亿-1万亿参数。
同样是未知数的,是微软到底为OpenAI提供了多少算力,这个数字也会是以 亿美金 为计量单位。
众多追赶者,都在追求“大就是好”,企图用更大参数规模,莽出一个智慧涌现。
而OpenAI的CEO,Sam Altman却站出来说: AI大模型已经发展到头了。
这不是凡尔赛,是OpenAI发现:更大规模,并不等于更强模型能力。
未来的模型发展方向,可能会是参数更小,或者多个子模型协同,从算法上去优化的空间更大。
科大讯飞既致敬OpenAI,又要赶超,走的就是这条更长远的路,也是一条自己的路。
·算法为王
“至少在讯飞,最关键的一定是算法”,科大讯飞研究院院长刘聪表示。
24年的积累,讯飞在Transformer深度神经网络算法拥有丰富经验,在语音识别、图文识别、机器翻译等任务都达到国际水平;
针对大模型模糊记忆技术短板,他们提出了知识与大模型融合统一的理解框架X-Reasoner;
截至2022年,讯飞累计斩获了常识阅读理解挑战赛OpenBookQA等13项世界;
目前,讯飞开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万。
星火虽未公布具体参数规模,但讯飞透露了 模型规模、算力都比GPT小 ,这种情况下,能做到模型能力不比它差,就有赶超的机会。
·数据破壁
国产大模型都遇到的另一个难题是,中文互联网世界的高质量数据,和英文数据有差距。
科大讯飞的解法,一是从全世界抓数据,中文英文都做;
二是通过更快落地AI产品,从行业积累高质量数据;
三是主动推进共建共享,助推政府和各界打通数据流,这也是今年来数字中国规划、组建数据局的核心任务。
科大讯飞的优势,是在教育、医疗等行业垂直领域的数据积累,护城河很深。 在多年认知智能系统研发推广中,积累了超过50TB的行业预料,和每天超10亿人次用户交互的活跃应用,这不可小觑。
·算力自主
更多人的担忧,是在算力和芯片层面。
英伟达的A100/H100两款高性能芯片,是现在研发AI的刚需。中国厂商如果不是之前有囤货的,现在很难再摸到了。
即便是中国的“阉割版”A800/H800,目前也是供不应求、千金难买。之前流传出一份会议纪要,透露国内几个大型互联网企业,都在上万张地下单。
一是自建了业界的AI数据中心,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速;
二是与华为、中科曙光、寒武纪这些国产硬件企业深度合作。
1999年,18个中科大的学生挤在出租屋里,创造了语音AI的源头技术。24年过去,信念都在成为现实,好比 星星之火、可以燎原 。
讯飞从源头到整个生态都要自主创新,把AI能力建在自主可控的平台上 ,进一步也推动了中国人工智能产业生态发展。
免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.
精彩推荐
-
采购拿回扣问题,教你一个小妙招,看看怎么做!
2017-09-18 11:09 广告 阅读
-
苦逼的老板,教你一个小妙招,怎么防采购拿回扣!
2017-09-18 11:09 广告 阅读
-
传播易上线视频制作频道
2020-11-18 14:03:07 更新 阅读
-
尖货爆料!速来【数码预爆台】领取618福利和AI新
2024-06-21 18:33:22 更新 阅读
-
喜获国际设计大奖丨十字勋章减重大师Pro商务背包
2024-06-12 14:04:28 更新 阅读
-
Baseus倍思音频品鉴会:一场产品与技术的对话
2024-05-29 11:13:32 更新 阅读
-
212携手极致军工品质,焕新出发
2024-05-22 21:16:00 更新 阅读
-
第四届全球应用算法BPAA大赛再度升级,增添三大
2024-05-17 17:55:36 更新 阅读
-
三维天地助力实验室质量管理工作无纸化、流程化
2024-05-09 15:35:04 更新 阅读