首页 > 热点 >  >  > 正文

灵活使用科研经费、采用中长期综合评价机制 上海期智研究院为基础研究营造更好环境

2023-08-09 18:41:59 来源:上海市徐汇区人民政府网站

记者 俞陶然

“喂,小星,我在二校门,帮我拿一顶学士帽过来,快点啊。”上海期智研究院PI(首席研究员)、清华大学交叉信息研究院助理教授陈建宇向记者展示的视频里,可爱的人形机器人“小星”能双足行走,未来可以帮人完成取物品、做烧烤等各种任务。

近日,这款机器人亮相2023世界人工智能大会,引起很多科技界、投资界人士的关注。图灵奖得主、上海期智研究院院长姚期智院士在大会上表示:人工智能领域下一个重大挑战将是实现“具身通用人工智能”,也就是研究如何构建出高端机器人,让它通过自我学习掌握各种技能,能执行现实生活中的通用任务。


(资料图片)

陈建宇等青年科学家得到了上海期智研究院提供的经费、人才、成果转化等多方面支持,为他们从事人工智能等基础研究营造了更好的环境。“我在清华和期智研究院都有团队,研究院的全力支持,会加速我们的研发进程。”陈建宇说。

信任科学家给予科研自主权

上海期智研究院是一家事业单位性质的新型研发机构,实施“三不机制”,即不明确机构规格、不核定事业编制、不受岗位设置和工资总额限制。与传统的事业单位相比,这家研究院在科研经费使用上有更大的灵活度。“我们实行负面清单管理,支持期智研究院围绕既定的目标任务,根据科研活动实际需要,将财政经费用于人员、设备、试验、交流等方面,具体如何使用由研究院自主决定。”市科委基础研究处处长宋扬说。

这种自主权给予科学家充分的信任,也体现了政府在竞争性科技项目之外,支持基础研究的路径探索。

陈建宇就是这种制度创新的一位受益者。在上海期智研究院,他的团队获得了稳定的课题经费支持,基本保障了科研需求,因此可以将申请竞争性项目的时间用于基础研究。上海期智研究院的课题申请流程精简,重点考核PI团队的研究兴趣是否与研究院主要发展方向一致,且是否具备一定的研究基础。课题的申请—立项周期较短,经费使用采取包干制,允许PI根据实际科研情况调整各科目的经费。在评价环节,研究院充分考虑基础研究的特点,对各个PI团队进行差异化的绩效评价,更注重科研成果的创新性和国际影响力。

谈及自己的课题,陈建宇说:“通用人工智能是人类的一个梦想,它像人一样可以干很多事,不再局限于某些特定任务。ChatGPT只能处理文本信息,而我们认为,未来的通用人工智能需要具身的物理实体,要有眼睛、耳朵、手和脚,从而在物理世界与人更好地交互。”

软硬件攻关让机器人灵活有力

陈建宇认为,“具身通用人工智能”的最佳载体是人形机器人,因为人类社会就是由人类、为人类建造的,拥有人的形态和人体基本功能后,机器人可以便捷地进入各种人类工作和生活场景,双腿步行或跑步,双手使用工具,用手指进行精细化操作。

未来,当装有人工智能大模型的人形机器人投入商用,我们的社会将发生巨变——机器人可以从事一些过去只有人类才能做的工作,它们不知疲惫,专注度也不会下降;它们还将进入家庭,从事家政、护理、教育等服务。

面对美好的未来梦想,人形机器人“小星”研发计划应运而生。陈建宇介绍,这种机器人在硬件和软件层面的技术要求都非常高,将步行、移动导航、手部操作等几乎所有的机器人功能集成到一起,而且要相互配合。

比如在手和腿协调性方面,当人工神经网络同时发出手和腿的控制指令后,机器人的手部动作可能影响双腿行走,导致摔倒。为此,他带领团队在软件层面进行攻关,研发出一种去中心化的机器人控制方式。它能自动分析神经网络发出的指令,将手和腿部的运动指令解耦开,但不会解耦左腿和右腿等需要协同的运动。这样一来,机器人就能一边走一边进行手部操作。

在硬件层面,他带领团队采用“本体感知驱动器”这一新的技术路线,将高扭矩密度的电机与低减速比的减速器、电流环力控、动态双足行走算法相结合,使机器人具有力量大、移动灵活等高性能,而且制造成本较低。“电机扭矩密度是评估人形机器人硬件性能的一项重要指标,这个指标高,说明机器人力量大,同时还能灵活移动。”陈建宇说,“目前,学术界在这个指标上做得最好的是加州大学洛杉矶分校和麻省理工学院,达到38牛·米/千克。‘小星’的扭矩密度是30牛·米/千克,我们在开发的第二代‘小星’将达到34牛·米/千克。”

中长期评价让科学家潜心研究

2023世界人工智能大会上,“小星”的亮相引起了很多与会者的关注。1.2米的个头、白色的机身、步行速度0.7米/秒,这款机器人萌态可掬。

这是第二代“小星”人形机器人。陈建宇团队正在快速进行软硬件迭代,以后的“小星”会更高大、步行速度更快。在上海期智研究院的算力支持下,他们开展了物理仿真实验,仿真显示“小星”的奔跑速度极限可达4米/秒。

通过模仿人类动作的强化学习,这款机器人不仅能学会走路,还能学会双手配合完成任务,如左手抓住一个球并把它移交到右手、双手一同拎起一口锅。

强化学习解决的是人形机器人执行层问题,作为决策层的任务规划,则由大语言模型负责。将人形机器人与大语言模型结合后,会遇到一个难题——大模型规划的任务不一定得到很好执行。为此,陈建宇团队在决策层、执行层之间加入了自动监控系统。这个系统由视觉语言模型组成,能自动监测并推理任务执行情况。比如在执行搬箱子任务时,机器人手中的箱子如果掉了,自动监控就能检测出来,并向机器人发出“捡起箱子”的指令。

他们还通过训练改进了大语言模型本身,使其学会了主动提问,以提高机器人执行任务的效率。比如,当机器人被要求到一个不熟悉的房间找东西时,它会问房间的主人:“您知道这件东西在哪里吗?”而不是直接进房间翻箱倒柜。

据介绍,上海期智研究院采用以创新绩效为核心的中长期综合评价机制,项目中期考核周期为3年。这一评价机制给了陈建宇等青年科学家充裕的时间,让他们可以潜心研究,为人形机器人未来进入家庭和工作场所奠定坚实的科学基础。

标签:

相关阅读
返回顶部