江苏机械门户网
 
用户名: 密码: 注册账号
 
文章查询:
 现在的位置:首页 >> 资讯
  最新图文
  资    讯 更多..
4 IOTE 2026 第二十五届国… 
4 福禄克助力第48届世界技… 
4 苏州发布具身智能机器人… 
4 破局高质量数据集建设,南… 
4 34 万㎡超大规模,5000+展… 
4 迄今规模最大“虚拟宇宙…
4 江苏“空天舰队”进发万…
4 江苏省“人工智能+”能源…
4 江苏工信领域行业高质量…
4 全链条部署 着力打造新兴…
  法律法规 更多..
4 明确六项重点任务!工信部…
4 国家网信办等五部门联合…
4 智能网联汽车领域出台两…
4 工信部等九部门联合发文…
4 关于印发《加快人工智能…
4 省工信厅关于公布行政规…
4 中共江苏省委关于制定江…
4 工信部编制完成2025年第…
4 《电力装备行业稳增长工…
4 两部门印发《工业母机高…
破局高质量数据集建设,南京激活智能经济核心动能

内容来源:江苏经济报      浏览次数:20      更新时间:2026-04-28

数据作为新型生产要素,已成为智能经济发展的核心引擎,而高质量数据集,正是推动人工智能技术迭代、赋能产业升级的“核心燃料”。近日,“数智未来”高质量数据集开发者创新大赛成果发布会在南京落幕。这场历时5个月、吸引全国30余所高校、70余家企事业单位同台竞技的赛事,不仅决出了五大赛道的优胜者,更清晰地折射出智能经济底层基础设施——高质量数据集建设的真实图景与发展诉求。

高质量数据集建设面临三大难点

今年政府工作报告提出“打造智能经济新形态”,国家数据局也于近日发布了《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,为产业发展划定清晰路径、指明前进方向。然而,高质量数据集建设之路并非坦途,当前仍面临三大突出难点。“你有数据,并不代表你拥有高质量数据集。”国家管网集团西气东输分公司科技数字中心副主任占传熙道出了实践中面临的核心困惑。

在占传熙看来,数据稀缺性是首先需突破的瓶颈。以焊缝缺陷数据为例,在管道建设过程中,存在缺陷的焊缝比例可能只有千分之几。“不仅数量稀少、分布零散,从项目现场采集回收后,还需经过多道处理工序,综合成本极高。”他说。除此之外,数据专业性不足同样制约发展:焊缝底片的判读需要专家积累多年实战经验,相关模型难以在短时间内实现规模化复制与应用。同时,数据泛化性不足的问题也尤为突出。“世界上没有两个完全相同的缺陷。”占传熙表示,即便模型学习了上万张样本,进入真实应用场景后,仍需持续优化算法、适配实际需求。

对于这些痛点,徐工集团全球数字化中心部长李忠福同样深有体会。他表示,以挖掘机核心部件液压泵为例,其完整使用寿命约为3000小时,但企业在过往实践中,通常只关注其最后“失效”的1小时。“从全新状态到完全退化的全过程数据,分散在生产、服务、研发等各个部门,一方面,大家不愿主动拿出‘不够完美’的数据;另一方面,部门间的壁垒也导致数据无法有效互通。”李忠福坦言,这种“数据孤岛”现象,让构建完整的寿命预测曲线变得异常艰难。

在卫星遥感赛道,自然资源江苏省卫星应用技术中心总工詹雅婷用一组具体数据,直观展现了高质量数据集建设的难度:大赛相关任务涉及280万个样本,其中200万个用于变化检测,标注精度必须达到95%以上,才能实现“好用、管用”的核心目标。“卫星每天拍摄海量影像,仅依靠人工标注几乎不可能完成,必须通过AI技术自动初筛,再辅以人工精修,才能兼顾效率与精度。”她说。

产教融合打通“最后一公里”

正是这些产业一线的真实痛点,催生了本次大赛“真题真做”的核心模式。5家链主企业把生产中最复杂的场景、产线上的真实数据、最稀缺的样本向全国青年学子敞开,让科研创新真正扎根产业实践。

“我们希望通过大赛把生产中的实际难题摆出来,与高校深度对接,搭建科产融合的桥梁,挖掘更多合作机会。”中信数字科技集团战略发展部总经理钱卫表示,产教融合的价值,正是在于让学术智慧与产业需求同频共振。

这种融合不仅发生在赛场内,更延伸到赛场外。北京传世博润科技有限公司高级副总裁袁立飞分享了一个细节:有个医院团队原本为多人组队,为符合大赛人数限制,拆分为3支队伍,分别由临床科、信息科、同位素科的人员组成。他建议3支队伍保持密切交流,“高质量数据集的构建,从来不是单一科室能完成的,需要多方协同、汇聚各类专业智慧”。

大赛带来的最直观成果,莫过于人才的精准对接。袁立飞透露,大赛期间,已有企业向表现优秀的学生发出实习邀请,部分学生还获得了参与国家级项目的机会。“让学生在实践中提升能力,同时获得实实在在的实习、就业机会,这正是大赛最实在的价值。”

为数据工匠提供的支持还有更多。以南京市玄武区为例,这里正全力打造国家级数据产业集聚区核心区,目前江苏国际数据港一、二期超50万平方米产业空间已正式投用,人工智能产业母基金顺利落地,同时推出青年人才房票及超千套人才公寓,全方位为数据领域人才“创业无忧、创新有成”提供坚实保障。

多点突破打响“持久战”

什么类型的数据最“值钱”?南京市创新投资集团人工智能部投资总监张苏荣从资本视角给出了清晰的判断标准。“首先是私域数据,这类数据不出场、不出域,具有独特性和稀缺性,价值最高;其次是场景数据,比如电子病历沉淀的诊疗记录,对医药研发具有极高的参考价值;再次,能形成数据飞轮的高质量标注数据,以及刚需领域的科学数据,同样具备很高的价值。”

他用一个形象的比喻,阐释了高质量数据集的价值层次:“从原始数据到可用于模型训练的语料,中间需经过清洗、标注、校验等多道精细化工序。如果数据泛化性好,就能实现从一次性买卖向可重复利用的资产转变,持续释放价值。”

大赛虽已圆满收官,但高质量数据集的建设之路任重道远。国家数据发展研究院副院长袁军透露,国家数据局管理的国家数据集管理服务平台将于4月29日试运行,未来将持续完善相关标准与评测体系,构建行业基准模型与测试数据集,为高质量数据集建设提供有力支撑。

李忠福的期待则更为具体:“我们渴望构建工程机械核心部件从全新到失效的全生命周期数据集,让每一台设备都能‘预知’自身健康状况,推动客户从‘购买设备’向‘购买服务’转型,真正实现产业赋能。”

作为长三角数据产业的重要枢纽,南京正以先行姿态推动高质量数据集建设与产业发展深度融合,当前其数据产业发展已呈现出多点突破、全面提速的良好态势。“我们已出台数据基础制度配套政策,扩大公共数据授权运营,率先建成城市算力网,建设可信数据空间,为数据集开发提供政策、平台、算力全方位保障。”南京市政府副秘书长陈友明表示,如今的南京,已构建起“政策护航、平台支撑、算力保障、人才集聚”的完整数据产业生态,依托江苏国际数据港等核心载体,吸引了一批优质数据企业、科研机构落地扎根,在智能制造、智慧医疗、智慧城市、金融服务等领域形成了特色数据应用场景,逐步打破“数据孤岛”,推动数据要素高效流通、价值充分释放。

高质量数据集建设是一场持久战。此次大赛让产业界、学术界、资本界清晰看到:真正的攻坚,早已在生产线的轰鸣声中、医院的病房里、卫星遥感的广阔赛道上悄然拉开序幕。南京正以坚实的产业基础、完善的配套保障、开放的发展姿态,在这场“持久战”中主动作为、率先攻坚,持续激活数据要素价值,推动智能经济高质量发展。

分享到:

 
版权所有:江苏机械门户网  苏ICP备14020118号-1

该网站由小贝网络工作室提供技术支持

 
360网站安全检测平台