首页 > 科技资讯 > 正文

AI大模型在千行百业大有可为,华为、阿里、科大讯飞等国内科技企业纷纷入局

        【每日科技网】

今年一季度,基于深度学习的大型语言模型ChatGPT迅速爆红,全球用户数强势破亿,成为史上用户增长最快的消费级应用程序。风靡世界的ChatGPT还引发了全球新一轮AI技术迭代浪潮,它与传统“对话机器人”相比读懂人类意图再作答,背后融合了机器学习、神经网络和Transformer模型等多种技术模型。ChatGPT是在GPT3基础上进一步开发的NLP大模型,参数规模由“千亿级”迈入了“万亿级”。

想要实现从大模型到“ChatGPT”的进阶,我国的“底子”也不差,多个国内企业研发出了基于文本或多模态的预训练基础大模型。但要打造一个类ChatGPT大模型还是任重而道远。在数据方面,需要保障用户隐私安全,符合各国法律法规和政策;在算力方面,需要大规模计算集群和对应模型并行算法框架的支撑;在工程实现方面,需要将大模型部署在线上云端,以供大规模用户快速地、经济化地使用。

中国信通院云计算与大数据研究所人工智能部副主任曹峰曾指出,AI大模型是人工智能迈向通用智能(AGI)的里程碑技术,同时具有大规模和预训练两大属性,面向实际任务建模前会在海量通用数据上进行预训练,解决了通用数据激增与专用数据匮乏之间的矛盾,大幅提升了AI的实用性。但由于自研AI大模型技术难度极高、对数据需求极大以及研发时间以“年”为单位,国内可做AI大模型的企业屈指可数。

根据人工智能大事件日历,在4月到5月期间,大量国内科技公司将集中发布基于AI的大模型以及AI软硬件新产品。其中有媒体报道商汤科技要发布的大模型,其画图功能将超过MidjourneyV4,搭配自研新型AI基础设施SenseCore,打通了算力、算法和平台,有助于低成本实现规模化AI创新落地。

科大讯飞则计划在5月6日发布认知智能大模型,并采用“1+N”架构。其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、工业等多个行业领域的专用大模型版本,比如通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。据悉此次讯飞AI学习机、讯飞听见等产品将成为该项技术率先落地的产品。科大讯飞副总裁、研究院执行院长刘聪曾表示讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑以及团队组建等方面建立了“护城河”,非常有信心实现ChatGPT类似的技术跃迁。

除了“国产军团”外,国外知名公司AIGC Chain与微软、谷歌两大科技巨头也将有“大动作”。AIGC Chain将发布全球基于Web3的GPT大模型、谷歌将在I/O 2023全球开发者大会展示多款AI产品、微软将在Build 2023开发者大会带来更多AI领域计划。显而易见,随着越来越多大公司在AI领域发力,将使得缺少AI技术沉淀和数据资源的企业逐渐“掉队”,整个产业正在呈现“大浪淘沙”的新局面。

未来,AI大模型将成为千行百业数字化转型的技术基础、场景基础和数据基础,只有基于行业数据与知识形成专属定制解决方案,才能帮助各行各业跨越认知智能技术的壁垒,提高企业和产品竞争力,最终实现“AI+”协同创新。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.