首页 > 科技资讯 > 正文

土豆数据CEO霍向琦: 基于MLOps理念做行业大模型

        【每日科技网】

  智能时空云服务商土豆数据,立足于云原生+AI致力打造时空信息数字化基础设施“弗雷云”。此前,土豆数据推出面向时空产业的行业大模型产品——弗雷时空大模型。

  据悉,弗雷时空大模型由土豆数据在通用大语言模型、视觉大模型、多模态大模型基础上,进一步采集时空产业公开可用的行业知识和数据进行微调训练构建而成,同步衔接自主研发的时空信息采集、建模、治理、分析、应用及流通等全生命周期基础软件,满足测绘、自然资源、智慧城市、生态水利等众多时空产业垂直细分领域有关行业知识问答、内容创作,以及业务处理方面在行业数字孪生时空底座高效搭建、数据分析挖掘等需求。

  对于行业大模型如何建设,土豆数据科技集团董事长兼CEO,近日在由第一财经举办的《AI大模型——揭秘人工智能生产力的加速器MLOps》风口调研讨论活动中提到,MLOps是构建AI生产力不可或缺的一种工程化方法论,随着AGI和AIGC时代的到来,MLOps将充分融入大模型产品的工程化构建能力之中,作为一种基础设施,提升开发效率、解决行业需求。

  霍向琦在演讲中提到,平台化,以及深度融入MaaS(Model as a Service)体系,是MLOps在大模型发展的浪潮之中,从一种工程方法转变为基础设施和平台工具的重要趋势,通过聚焦数据要素、持续训练、应用场景这三个重要的方向,真正构建起端到端的能力优势解决行业需求。

  例如,跨部门协作、敏捷开发、高效运维等来自于MLOps的理念,将落地成为围绕数据标准规范、模型开发训练、部署应用等相关的平台工具集,来支撑通用大模型和行业大模型产品的构建。

  早在“小模型”时代,MLOps理念已贯穿AI模型的开发、训练、部署和应用的全流程,提升各环节的协同效率,降低了开发难度和成本。随着大模型时代的到来,MLOps的平台工具化沉淀,将进一步促进通用人工智能技术转化为能够解决行业实际痛点的真实生产力。

  但霍向琦根据产业发展的实际情况提到两大问题:

  首先,从国内现状来看,很多行业尚处于数字化转型的建设初期,其中最典型的问题,要属数据资源普遍以不同的行业标准和不同的文件格式分散在跨单位、跨部门的服务器或电脑端中,未能经过统筹治理形成标准统一的数据资产。“数据底座”即数据要素的缺失,难以为行业大模型的训练提供可靠、高质量的数据支撑。

  另外,大模型相比小模型的开发应用,更偏向于建设一个系统级工程,必须做好数据工程和模型工程基础,并需要完成与终端用户业务系统的配套改造和对接,从而响应行业大模型持续训练和场景搭建封装等关键任务需求。

  因而整个过程既需要技术人才下探场景、理解需求,也离不开终端用户对大模型价值和应用场景的准确把握。

  霍向琦提到,在土豆数据打造弗雷时空大模型的过程中,基于MLOps理念提升模型产品开发和行业服务的效率,在降低专业操作门槛、减少劳动密集作业的同时,本质上更让各环节上的技术人员、行业专家和终端用户能够高效协同,将大模型能力、数据资产、行业知识、想象力和创造力转化为真实生产力,从而高效赋能时空产业的各细分领域。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.