7月2日,北京发布全国首个政务服务大模型场景需求。共涉及市政务服务管理局、市中小企业服务中心等32个项目,涵盖智慧政务、智慧办公等14类场景。与此同时,全国多地正在以大模型作为人工智能发展突破口,抢占行业和市场发展新高点。
2023年的科创圈“顶流”非大模型莫属。截至7月3日,我国10亿级参数规模以上大模型已超80个,大模型产业将进入“百模大战”时代。如何看待这一场热到发烫的大模型竞赛?大模型的下一个“赛点”在哪里?
科技公司逐鹿大模型
科技公司正在逐鹿大模型。7月3日,上海人工智能实验室联合国内外顶级科研机构、高校及医院共同研发的全球首个医疗多模态基础模型群“OpenMEDLab浦医”对外发布。近日,天眼查与华为云共同发布全球首个商查大模型——“天眼妹”可信商业助理。目前,该产品已经完成内部测试,预计本月底对用户开放邀请试用。6月29日,美团于香港联交所发布公告,称已完成对大模型创业公司光年之外境内外主体100%股权的收购。
自今年3月,基于文心大模型3.0打造的百度新一代知识增强大语言模型“文心一言”公开邀测之后,阿里通义千问、讯飞星火大模型、智谱AI的ChatGLM 等纷纷发布。此后,美团、百川智能、云知声、美图、腾讯……新加入大模型赛道的国内科技公司此起彼伏,目前10亿级参数规模以上大模型已超80个,“百模大战”即将开启。
“我们把大模型及相关产品分为三类。第一类是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大讯飞的‘星火’等都属于通用大模型。第二类是行业大模型。第三类是基于通用大模型或行业大模型的应用型服务。目前已经发布的产品大多集中在第一类和第二类。”有业内人士表示,“从参数量来看,‘文心一言’等通用大模型的参数量在1000亿级别,其他企业或初创公司大模型参数量通常在100亿、10亿级别。”
全国多地正在以大模型作为人工智能发展突破口,抢占行业和市场发展新高点。7月2日,北京发布全国首个政务服务大模型场景需求。共涉及市政务服务管理局、市中小企业服务中心等32个项目,涵盖智慧政务、智慧办公等14类场景。北京市政务服务大模型在国内外探索大模型助力政务管理实践方面具有极强的示范带动意义,在推动大模型赋能千行百业、加快推进大模型商业化落地应用等方面也极具吸引力。
下一个“赛点”在何处
“百模大战”的下一个“赛点”在何处?业内表示,大模型未来之争聚焦创新提效,其商业化落地最为关键。大模型产业是未来科技竞争的关键较量之一。业内人士表示,对于大多数企业而言,面向垂直场景、垂直行业、垂直领域探索基于大模型的应用创新,将是重点攻克的方向。局部的跑通将带动行业整体景气度、创新热情和创造活力提升。
据了解,在政务、公共安全、医疗等领域,垂直领域应用型大模型正在陆续落地。上市公司拓尔思基于自有的公文、政策文件、政务办事指南等数据作为专业训练数据,打造了政务专业大模型;美亚柏科自主研发的MYAI大模型聚焦垂直领域应用,目前已在公共安全、政务、税务、企业数字化转型等多个行业领域的大数据项目建设中得到应用。
对于国内从科技巨头、科研机构到初创企业等一众力量均投身大模型热潮的现象,北京智源研究院院长黄铁军呼吁,国内的大模型行业参与者应走出“山头林立”、各自为政的思路,加强协作。火山引擎总裁谭待也表示,企业使用大模型,未来可能会呈现“1+N”的模式:“1”是通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。
近日,火山引擎就发布了“火山方舟”,首批集成百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI这7家AI科技公司及科研院所的大模型,意在打造一个大模型“优选店”。谭待介绍,基于“方舟”,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。
深度科技研究院院长张孝荣表示,现在国内的大模型还在实验室阶段,厂商需要更多时间和资源去训练模型、调试参数等,市场竞争环境有利于产业发展,最后必然是大浪淘沙。
数据底座的安全意识还需加强
伴随着大模型等人工智能产业的快速发展,也面临新的安全风险挑战。360集团创始人周鸿祎认为,目前企业级场景落地大模型面临数据安全隐患、无法保障内容可信等问题。清华大学人工智能研究院副院长朱军表示,AIGC特别是ChatGPT出现以后,数据泄露、利用AIGC技术进行诈骗、通过虚假内容进行黑产攻击、代码生成进行网络攻击等人工智能安全问题越来越严重。面对当下安全风险挑战,朱军认为,应针对算法原理、深度学习、深度神经网络等进行研究,发展更加安全可靠的人工智能框架。同时,提升对对抗攻击、角色扮演、误导欺骗的识别和防御、数据投毒等问题的安全评测能力。
周鸿祎建议,大模型产业化需要遵循“安全、可信、可控”三个原则。他表示,安全方面,要注意网络安全、数据安全、算法安全和生成内容安全。可信要做到搜索矫正、知识矫正、对齐训练,解决“幻觉”知识模糊等问题。可控方面,不能马上向大模型开放API、函数,要采取监控审计手段,把安全风险“关在笼子里”。
中国政法大学互联网金融法律研究院院长李爱君认为:“现在最大的问题难点在于对责任主体的认定难度越来越大。”李爱君建议,要客观评估大模型技术发展对人类生活的影响,进一步加强数据底座安全意识,在数据层面进行规范治理,强化责任主体意识,提升整体安全水平。“同时,进一步完善相关法律法规,为大模型等人工智能行业的健康发展保驾护航”。
据悉,各行业大模型标准的编制工作也已经“在路上”。“我们已启动金融、电信、教育、法律、电力、汽车、传媒、政务等行业大模型标准的编制工作,围绕技术能力、服务能力、应用场景等方面形成评价指标,全面评估行业大模型的综合水平。”中国信息通信研究院云计算与大数据研究所副所长魏凯说道。 |