合肥建设高质量数据集 激活城市有机生命体-新华网
新华网 > 安徽 > 正文
2025 07/16 17:12:40
来源:数字合肥

合肥建设高质量数据集 激活城市有机生命体

字体:

  数据被誉为数字经济时代的“新石油”,如何将其“炼化”为驱动人工智能发展的新动能?合肥正全力作答:通过构建高质量数据集,激活千行百业创新蝶变,描绘智慧城市新图景。

  解码核心:何为高质量数据集?

  在数字经济时代,数据已成为关键生产要素。建设高质量数据集,正是实现数据价值从“潜在”到“现实”的关键。

  安徽数据堂科技有限公司副总经理张子斌这样解释:“刚设计出的人工智能和大模型算法,就像‘新生儿’,高质量数据集就是它的‘启蒙教材’,能引导它从懵懂走向睿智。”

  而编写这些“教材”,AI技术本身成为重要助力。张子斌介绍,该公司的“数加加”人工智能标注平台创新应用AI辅助标注技术,让人工智能反哺标注过程,效率大幅提升,“同样的工作量,现在只需过去20%的人工时间。”

  从民生领域看,高质量数据集让医生拥有“诊断助手”,借助AI辅助为居民生成个性化健康建议;学校依托大模型技术为学生精准画像,实现因材施教。在产业层面,工厂凭借高质量数据集装上“火眼金睛”,自动化生产线次品率显著下降;AI客服从“答非所问”升级为“精准回应”,大幅提升用户体验。

  合肥市数据资源管理局相关负责人表示,合肥将持续建设高质量数据集,为人工智能产业提供充足“养分”,通过不同场景的训练优化,推动大模型在千行百业落地应用。

  释放动能:构建“智慧+”新图景

  高质量数据集,如同流淌在城市脉络中的“智慧血液”,正深度融入合肥的产业肌理与生活场景。

  在合肥高新区,人工智能初创企业智象未来(合肥)信息技术有限公司凭借多模态数据展现出强大实力。该企业自主研发的超百亿参数“智象多模态大模型”,依托行业内丰富的多模态版权语料库,具备强大的视觉内容生成与理解能力。作为首批完成“模型+算法”双备案的国产多模态大模型,其生成的视频内容逻辑严密、流畅自然、画质高清。

  在金融领域,高质量数据集又“扮演”成洞察风险的“智能雷达”。

  合肥大智慧财汇数据科技有限公司深耕金融领域23年,拥有海量金融数据及企业数据资源。该公司以构建高质量数据集为核心,深度融合人工智能与大数据技术,自主研发企业图谱、风险传导模型等智能化分析工具,实现数据价值的深度挖掘与高效转化。

  同时,在城市街头也有“数据身影”。合肥公安交警部门通过升级部署900万像素高清智能摄像头,将交通监管精度推向新高度。这些“鹰眼”不仅能精准识别车牌,更能清晰捕捉驾驶舱内细节——安全带是否系牢、有无驾车使用手机或抽烟等危险行为,尽收“眼”底。

  合肥市公安局交通警察支队交通科研所副所长尹成胜说:“系统深度融合人脸识别技术,通过数据碰撞,可以快速确认驾驶员身份。这套覆盖汽车、非机动车等全部出行工具的系统,如同一位不知疲倦的‘电子交警’,可以有效规范秩序,为市民出行织密安全防护网。”

  聚力成势:打造数据产业新高地

  “大模型是概率分布模型,其使用的数据来源分布会使其具备相似的人类意志。在训练中融入更多中式价值观内容,能让它更贴合中文使用者的文化底色与价值倾向,在全球化浪潮中守护文化的多样性与独特性。因此,构建高质量数据集意义重大且刻不容缓。”合肥市数据资源管理局资源处相关负责人表示。

  作为国家“数据要素×”三年行动计划的积极践行者,合肥推出《合肥数据标注产业发展规划(2025—2027 年)》《合肥市促进数商发展的指导意见》《深化数据领域综合改革推进城市化转型的实施意见》等一系列政策“组合拳”。计划2025年结合人工智能等产业发展需求,推进人工智能、低空经济、交通物流、金融信息、公共安全、医疗教育等重点领域高质量数据集建设,全年打造不少于10个高质量数据集;到2027年,拉动数据标注产业规模突破30亿元,建成覆盖汽车、医疗、交通等领域不少于30个行业数据空间。

  在合肥,创新活力奔涌,越来越多的科创新苗正拔节生长:安徽飞数针对多语种多模态科研数据获取难、高质量数据匮乏等问题,研发智能化生产工具,赋能跨学科科研创新;云智数界深耕文化创意领域,通过构建高质量文化创意数据集,推动数字文旅产业从传统业态向数字化、场景化、IP化转型升级;互联智库专注政务数据治理,整合近千万条标准化12345热线数据,提高政务服务响应效率……

  截至目前,合肥市大数据企业达2246家,逐渐形成“多点开花、集群发展”的产业格局。随着政策红利持续释放、产学研协同不断深化、企业创新活力加速迸发,合肥必将在数字经济的浪潮中,刻下更鲜明的“印记”,让数据价值真正转化为发展动能、民生福祉。(黄紫燕)

  

【纠错】 【责任编辑:钟红霞】