发布时间:2026-03-20 19:07:21 浏览:

当数据不再只是被动沉积的资源,而成为可以在开源体系中持续流动、赋能千行百业的“地基”,我国人工智能产业的高质量发展和数字经济的创新也将拥有更坚实支撑。
本次活动以激活数据价值、共筑开源生态为核心,聚焦人工智能开源数据集建设与发展,搭建起产业界、学术界与开源社区的深度交流平台。
工业和信息化部信息技术发展司有关负责同志、上海市经济和信息化委员会总工程师裘薇、上海市徐汇区人民政府副区长陈勇、开放原子开源基金会理事长程晓明等领导出席活动。
将这场活动放在国内人工智能产业的坐标系里看,它释放出一个核心信号:将高质量数据集、开源社区与产业落地这三件事拧成一股绳,我国人工智能的发展将会拥有更坚实的支撑。
如果说过去一轮人工智能竞争,外界最常讨论的是模型参数、算力储备和发布节奏,那么走到今天,一个更现实的问题已经摆在台前:模型可以快速迭代,但高质量数据集并不会凭空出现。
在此次活动上,各方达成的共识直指这一痛点:数据不再是企业的私有护城河,而是需要共同培育的公共基础设施。
工信部信发司相关负责同志指出,打造具有高影响力、强辐射力的开源社区,切实推动开源赋能产业创新发展是加快建设高水平开源体系的重中之重。
“希望各界广泛凝聚共识、深化交流合作,做高质量社区的共建者、链接社区和产业的推动者、开源价值转化的探索者,实现在流通中创造价值、在开放中形成商业闭环,为产业转型升级注入源源不断的活力。”他表示。
她举例,上海2025年已实现100万条高质量思维链数据开源、OpenLoong社区超10万条动作数据开放等成果。
上海市徐汇区人民政府副区长陈勇表示,徐汇区作为上海人工智能产业核心承载区,加快建成全国人工智能高地,集聚众多优质企业,落地多家重点机构,打造了集算力、语料等要素一体的人工智能全栈产业生态。
“徐汇区也将做好属地服务,邀请优秀的年轻人投身人工智能这一年轻的事业。”陈勇表示。
在本次会议上,开放原子开源基金会理事长程晓明表示,基金会秉持中立开放宗旨,累计孵化52个开源项目,打造了AtomGit人工智能开源平台,汇聚数百家生态伙伴,有力助推软件产业发展、赋能千行百业数字化转型。
“本场‘园区行’聚焦开源数据集主题,是基金会深化人工智能开源生态建设、夯实数据要素基础的重要举措”,程晓明补充道。
当前,全球具身智能竞赛已进入白热化。在此过程中,中国企业的机器人在春晚舞台上展现出的精准动作控制能力引发全球关注。
如果说动作控制能力是具身智能的“小脑”,那么大模型则是具身智能的“大脑”。想要让大模型能够进化地更快,高质量的训练数据是不可缺少的一环。
为了让开源数据集更好地赋能行业,在本次活动上,开放原子开源基金会人工智能开源数据集领域三项举措集中推出,为我国人工智能开源数据生态建设进程增添了新的实践探索。
在活动现场,开源数据集工作组正式启动,该工作组由开放原子开源基金会牵头,联合产业、科研、标准制定等多方力量组建,将秉持规则先行、技术引领的原则,系统性推进开源数据集技术规范、标准体系、安全合规等建设,破解行业标准不统一、生态协同不足等痛点,助力我国开源数据生态高质量发展。
在活动现场,具身智能开源数据集社区同步成立,该社区由乐聚机器人牵头发起,以开放共治、标准共建、生态共享为理念,核心聚焦人形机器人领域真实数据开源与生态建设。
据悉,通过开源共享易倍EMC与持续运营,该社区将开放全尺寸人形机器人真机数据与模型训练工具链,构建开发者生态,孵化创新团队,为全球开发者、科研团队及企业搭建协作桥梁,加速具身智能技术的研发与产业落地。
在活动现场,OpenLET“触觉灵巧操作+全身运动”数据集在AtomGit人工智能开源社区全球首发。
据悉,该数据集包括指尖压力矩阵、六维力、RGB-D视觉等多模态信息,可实现“视觉-力触-动作”全链路同步对齐。
此外,该数据集中的全身协同数据覆盖41个关节控制信号,任务维度从基础行走延伸至深蹲、弯腰等高难度全身联动动作,实现高度拟人表现。
围绕具体场景构建高质量数据,并通过开源方式进入生态流通,成为本次活动的重要方向。随着这些举措的落地,行业相关领域的空白将被填补,AI开源数据生态基础也得以夯实。
在主题分享环节,来自企业、科研院所、高校的多位行业专家围绕开源数据集建设与具身智能发展展开深度分享,带来前沿的技术研究、实践成果与趋势展望。
乐聚机器人董事长冷晓琨从实践角度解读了真机具身数据产业生态的建设思路与落地成果、中国信息通信研究院人工智能研究所平台部副主任李荪剖析了人工智能高质量数据集的建设路径与开源开放研究方向、库帕思COO施佳樑展现了以数据为中心的人工智能发展新趋势。
此外,蚂蚁灵波科技、国家地方共建人形机器人创新中心、同济大学、百度文心大模型数据生态中心、安势信息等单位专家,分别围绕具身大模型实践、多模态数据应用、具身智能技术研究、数据生态建设、开源选型决策等主题进行分享,为开源数据集的建设与应用提供了多维度的思路与参考。
此次活动中,从标准与规范的发布,到社区化推动数据的开放共享,再到具体数据集的发布,本质上都是在向一个方向努力:将数据从“沉默矿藏”变成“流动黄金”。
当数据不再只是被动沉积的资源,而成为可以在开源体系中持续流动、赋能千行百业的“地基”,我国人工智能产业的高质量发展和数字经济的创新也将拥有更坚实支撑。
沪ICP备10213822号-2互联网新闻信息服务许可证: 网登网视备(沪)-1号 互联网宗教信息服务许可证:沪(2024)0000009 广播电视节目制作经营许可证:(沪)字第03952号
增值电信业务经营许可证:沪B2-20210968 违法及不良信息举报电话