由ChatGPT掀起的大模型浪潮仍在继续。被誉“AI第一城”的北京,率先将重点落在了政策上。5月12日-19日,《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》(以下简称《若干措施》)向社会公开征求意见,5方面21条措施涵盖了算力、数据要素、大模型技术、应用场景等诸多受到广泛关注的领域。而在AI“新基建”领域,《若干措施》也画出了一条涵盖算力、算法以及数据训练的清晰图谱。
算力、算法与数据
数据、算力和算法,号称人工智能的“三驾马车”,缺一不可。而眼下的重点在于,这场始于AI领域的全球竞赛,却先在算力上引起了一波“焦虑”。上个月,OpenAI停止ChatGPT Plus的销售,便让人猜测是因为需求量过大,计算资源供不应求,随着国内大模型相继入局,对于算力紧张的猜测也自然蔓延至国内。
《若干措施》的第一条正发力在这一领域,在组织商业算力定向满足本市紧迫需求、高效推动新增算力基础设施建设以及高效推动新增算力基础设施建设三个方面提出了具体的举措。
具体而言,《若干措施》提到,将加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员,新增算力建设项目纳入算力伙伴计划,加快推动海淀区“北京人工智能公共算力平台”、朝阳区“北京数字经济算力中心”等项目建设,快速形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。
在算法方面,《若干措施》提到,要开展大模型创新算法及关键技术研究,在数据方面,则更聚焦在“高质量”这一关键词。例如针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,《若干措施》便提到,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗等。
高质量的数据需要“国家队”的护航,在这一领域,《若干措施》表示,加快推动数据要素高水平开放的“国家数据基础制度先行先试示范区”建设,争创国家级数据训练基地,提升北京人工智能数据标注库规模和质量等。
“《若干措施》相当于一个非常明确的专项政策,用以统筹全市资源,更好地赋能、促进人工智能的发展,这种调集全市之力制定专门的政策规划推动一件事的情况,在全国范围内都是相对比较少见的。”北京社科院研究院王鹏如此评价道。
深度科技研究院院长张孝荣也认为,《若干措施》的亮点在于对人工智能产业三要素以及应用与监管方面都做了比较全面的部署和指导。“不过,在算法研究和基础软硬件研发方面,缺少可执行措施,有较大提升空间;在对于数据质量提升和建立统一算力调度平台方面,有些措施可以商榷,有的可以进一步完善。”张孝荣说。
应用场景牵引技术研发
技术创新的价值在于场景落地,人工智能也是如此。《若干措施》的第四部分,完全聚焦在通用人工智能技术创新场景的应用方面,政务服务将成为率先试点应用的领域,此外,推动医疗、科学研究、金融、自动驾驶、城市治理领域的示范应用也已提上日程。
以自动驾驶为例,《若干措施》便提到,支持自动驾驶企业研发多模态自动驾驶技术,发挥大型语言模型高维语义理解和泛化优势,基于车路协同数据和车辆行驶多传感器融合数据,提高自动驾驶模型多维感知和预测性能,有效解决复杂场景长尾问题,辅助提高车载自动驾驶模型泛化能力。
国泰君安曾表示,AI技术的跃进和爆款应用的推出,意味着人工智能产业进入应用场景大爆发阶段。今年3月,百度创始人、董事长兼首席执行官李彦宏透露,自2月百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
彼时,李彦宏就曾提到,人工智能会彻底改变今天的每一个行业。“AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”
王鹏认为,北京的人工智能发展,并不是简单地为了发展而发展,更多情况下是要跟城市整体的发展,如智慧城市、数字经济标杆城市等相结合。因为人工智能的发展不仅在于研发,而是在应用,而应用的本身就是数字经济的全产业链开放。从《若干措施》中也能看出,提到的重点发展方向除了基础研发之外,更多要以应用为牵引,与北京经济高质量发展进行深度的融合,让应用场景牵引研发。
不过张孝荣提到,大模型应用在全球也是起步阶段,需要大量时间探索,我们可以放慢节奏,不必急于一时。
立足首都,带动全国
早在ChatGPT走红之前,人工智能便已成为世界科技竞争的焦点。2017年7月,国务院发布的《新一代人工智能发展规划》将人工智能提升至国家战略层面,其中提到,2030年人工智能核心产业规模要超过1万亿元,并将带动相关产业规模超过10万亿元。
数据显示,截至2022年,我国人工智能产业规模已达到5080亿元,相较于2018年的2288亿元增长了122.05%,连续五年保持稳定增长。
首都北京的科技底色更浓。5月15日的2023中关村论坛新闻发布会介绍,2022年北京研发投入经费占比在6.5%以上,达到全国平均水平的2.7倍。在京国家实验室高质量入轨运行,全国重点实验室目前达到了80家,在全国排在第一位。2022年,北京平均每天新创办的科技型企业293家,不到5分钟就诞生一家科技型企业,独角兽企业102家,居全球第三。
中国数实融合50人论坛智库专家洪勇认为,北京人工智能产业发展拥有优质的科研与教育资源、浓厚的创新创业氛围、丰富的产业生态系统以及完善的政策支持等优势。
在他看来,《若干措施》对北京发展人工智能产业具有重要意义,它将促进创新发展,提升北京在算力资源和高质量数据方面的供给能力,推动创新技术的涌现。同时,它还将强化北京的核心竞争力,巩固其作为人工智能产业核心城市的地位。
此外,《若干措施》也将促进产业生态发展,形成完善的人工智能产业生态系统,推动合作与交流。最重要的是,它将带动经济发展,成为北京经济增长的重要引擎,促进北京在人工智能领域的引领地位。
王鹏也提到,在一系列优势的基础上,未来北京人工智能产业链布局可能会朝三个主要方向发展,首先是基础设施,其次是与数字化、城市转型升级等方面的融合,最后北京的人工智能不仅是服务北京,还要立足北京,辐射京津冀,服务全中国甚至辐射全世界,这才是北京作为首都,拥有如此多的积累后,应该达到的目标。
“换句话说,北京的人工智能一定处于我国人工智能的第一梯队,那么北京的目标就不单单是服务中国,而是要更好地‘走出去’。”王鹏总结称。
北京商报记者 杨月涵
请带有效截图联系Email:Hi@yami.site
文章如无特别注明均为原创!
作者:
F_Robot,
转载或复制请以
超链接形式 并注明出处 峰哥博客。
原文地址《
规模化算力供给、千亿参数量大模型研发、国家级数据训练基地 北京通用人工智能“基建”三步走》发布于2023-5-18
若您发现软件中包含弹窗广告等还请第一时间留言反馈!