AI大模型在千行百业大有可为，华为、阿里、科大讯飞等国内科技企业纷纷入局-每日科技网-报道科技公司的新科技创新!✅

【每日科技网】

今年一季度，基于深度学习的大型语言模型ChatGPT迅速爆红，全球用户数强势破亿，成为史上用户增长最快的消费级应用程序。风靡世界的ChatGPT还引发了全球新一轮AI技术迭代浪潮，它与传统“对话机器人”相比读懂人类意图再作答，背后融合了机器学习、神经网络和Transformer模型等多种技术模型。ChatGPT是在GPT3基础上进一步开发的NLP大模型，参数规模由“千亿级”迈入了“万亿级”。

想要实现从大模型到“ChatGPT”的进阶，我国的“底子”也不差，多个国内企业研发出了基于文本或多模态的预训练基础大模型。但要打造一个类ChatGPT大模型还是任重而道远。在数据方面，需要保障用户隐私安全，符合各国法律法规和政策;在算力方面，需要大规模计算集群和对应模型并行算法框架的支撑;在工程实现方面，需要将大模型部署在线上云端，以供大规模用户快速地、经济化地使用。

中国信通院云计算与大数据研究所人工智能部副主任曹峰曾指出，AI大模型是人工智能迈向通用智能(AGI)的里程碑技术，同时具有大规模和预训练两大属性，面向实际任务建模前会在海量通用数据上进行预训练，解决了通用数据激增与专用数据匮乏之间的矛盾，大幅提升了AI的实用性。但由于自研AI大模型技术难度极高、对数据需求极大以及研发时间以“年”为单位，国内可做AI大模型的企业屈指可数。

根据人工智能大事件日历，在4月到5月期间，大量国内科技公司将集中发布基于AI的大模型以及AI软硬件新产品。其中有媒体报道商汤科技要发布的大模型，其画图功能将超过MidjourneyV4，搭配自研新型AI基础设施SenseCore，打通了算力、算法和平台，有助于低成本实现规模化AI创新落地。

科大讯飞则计划在5月6日发布认知智能大模型，并采用“1+N”架构。其中“1”是通用认知智能大模型算法研发及高效训练底座平台，“N”是应用于教育、医疗、工业等多个行业领域的专用大模型版本，比如通过学习海量医学教材、论文和病例，实现专业的医疗领域对话式AI系统，打造“每个医生的AI诊疗助理，每个人的AI健康助手”。据悉此次讯飞AI学习机、讯飞听见等产品将成为该项技术率先落地的产品。科大讯飞副总裁、研究院执行院长刘聪曾表示讯飞基于认知智能全国重点实验室，已在核心算法、行业数据、算力支撑以及团队组建等方面建立了“护城河”，非常有信心实现ChatGPT类似的技术跃迁。

除了“国产军团”外，国外知名公司AIGC Chain与微软、谷歌两大科技巨头也将有“大动作”。AIGC Chain将发布全球基于Web3的GPT大模型、谷歌将在I/O 2023全球开发者大会展示多款AI产品、微软将在Build 2023开发者大会带来更多AI领域计划。显而易见，随着越来越多大公司在AI领域发力，将使得缺少AI技术沉淀和数据资源的企业逐渐“掉队”，整个产业正在呈现“大浪淘沙”的新局面。

未来，AI大模型将成为千行百业数字化转型的技术基础、场景基础和数据基础，只有基于行业数据与知识形成专属定制解决方案，才能帮助各行各业跨越认知智能技术的壁垒，提高企业和产品竞争力，最终实现“AI+”协同创新。