1. <nav id="v9zkc"></nav>
    
    
    1. <wbr id="v9zkc"></wbr>

    2. <wbr id="v9zkc"><pre id="v9zkc"><video id="v9zkc"></video></pre></wbr>
      <form id="v9zkc"><pre id="v9zkc"></pre></form>
      <nav id="v9zkc"></nav>
      <form id="v9zkc"><pre id="v9zkc"></pre></form><th id="v9zkc"></th>
      <wbr id="v9zkc"></wbr><wbr id="v9zkc"></wbr>

      南京大学教授俞扬:让机器帮你做决策!强化学习助力机器更智能
      本文作者:小易 2019-07-29 17:49:34 浏览量:2342 评论量:0

      人工智能决策技术落地远少于预测技术

      迄今为止,大部分人工智能落地的技术都在预测技术方面,而不是决策技术,目前决策技术的应用落地还很少。对此,俞扬以诊断报告作比喻,形象地指出,日常生活中想达到目的,比如看到诊断报告识别问题,我们不可能等着病的发生,而是想办法将病治愈。但是决策方面落地的技术非常少,据俞扬介绍,以往决策的途径可以分成以下三种。

      南京大学教授俞扬:让机器帮你做决策!强化学习助力机器更智能

      南京大学人工智能学院俞扬教授

      第一种是写规则,即通过程序员将决策方式或企业决策的解决方法写入系统中,这是决策技术的现状;第二种是做规划,将要解决的目标写下来,用机器找到决策,虽然机器自动解决问题,但问题的定义还是由人来做,一旦定义出现错误,定义的和真实的情况不符合,那么系统就没有任何途径能够修正这个定义。第三种途径是基于学习的途径,即基于数据驱动的途径,通过环境感知来定义应该解决什么样的问题。俞扬表示,第三种方法看起来更有可能解决真实环境中做决策的问题。

      机器学习的三大技术

      若将机器做决策放在学习的框架上,则可以分为无监督学习、监督学习和强化学习三大类技术。其中,无监督学习的数据没有任何标记,它所做的事是分析数据,从中发现数据结构是什么。而监督学习是目前落地最多的技术,通过很多标注的数据,告诉机器图像中是什么样的对象,让机器可以在数据中预测、识别到对象。

      强化学习是机器学习中的一个重要研究领域,从大量数据中反复学习找到最优解,只从最终产生的结果来倒推模型应该是什么,正好对应做决策。俞扬指出,实际上这两年强化学习在做决策方面有很大突破,突破主要是在规模上,此前大热的AlphaGo与AlphaGo Zero都是经过深度强化学习后,在游戏中“碾压”了人类。

      强化学习面临的困境

      虽然强化学习发展较快,但目前所有的成功案例都发生在电子环境下。俞扬认为,主要原因是现在的算法效率太低。因此也出现很多批评的声音,说强化学习,特别在引入深度学习后,需要的数据样本量更大,导致这种方法无法直接应用于实际中。

      俞扬指出,在很多传统工业,特别是机器人设计中,大家可能会很熟悉做模拟器。模拟器通常用于高成本的行业,在传统工业里,为了减少和真正环境的交互,通常在模拟器里先进行设计。那么,能否让机器在模拟器中学习决策呢?俞扬以购物平台为例,指出机器在了解买家行为的过程中,通过多代理模仿学习,根据买家数据进行观察再行动。他表示,机器学习决策所面临的环境更大程度上更困难,因为它是一个开放环境,而不是和固定的物理定律打交道。

      编后语:此文是根据南京大学人工智能学院俞扬教授于2019年5月在浙江宁波余姚举行的第六届中国机器人峰会上的《智能决策从虚拟到现实——强化学习落地》报告录音整理摘编部分而成,题目为编者所加。


      193

      说点什么

      登录后参与评论

      最新评论

      没有更多了哦~

      lucky 总收益: 200000.00元

      发单数: 4单

      胡歌欧巴 总收益: 102000.00元

      发单数: 3单

      机器人总动员 总收益: 100022.22元

      发单数: 45单

      三木 总收益: 10.00元

      发单数: 3单

      简单并联教学工位

      行业:教育实训 应用:教学演示

      叶轮风机自动上料

      行业:机械设备 应用:上下料

      电子产品自动化装配生产线

      行业:电子制造 应用:装配

      项目需求

      ¥面议 瓶装水全自动灌装装备

      截止日期:2019-08-31

       当风玉立  发布于 17小时前

      项目需求

      ¥面议 ABB-IRB-2600 机器人

      截止日期:2019-08-31

       当风玉立  发布于 17小时前

      项目需求

      ¥面议 砖块子自动化上下料装备

      截止日期:2019-08-31

       太平盛世  发布于 1天前

      项目需求

      ¥面议 塑料叉自动化上下料工作站

      截止日期:2019-09-05

       太平盛世  发布于 1天前

      二维码

      微信公众号

      项目经理

      打电话

      400-114-6868

      周一至周日: 08:30 - 18:00

      发需求

      回顶部

      方案咨询

      400-114-6868

      梧州刳枚投资有限公司