本篇文章2112字,读完约5分钟
11月26日,据财富网站报道,谷歌布莱恩团队联合创始人杰夫? 迪恩在与《财富》杂志的采访中说,研究者在推进人工智能时面临的挑战是如何将监督学习与非监督学习相结合。 还介绍了强化学习的应用实例,包括棋盘游戏、空旋转按钮的设置、街景的所有商业名称和标志的读取、卫星图像和医疗图像的分解等
在采用谷歌的大型搜索引擎,或者用谷歌地图查询路线时,背后实际上是“大脑”,提供相关的搜索结果,或者谷歌地图的顾客不会在驾驶中迷路。
但是,那不是人脑,而是谷歌大脑( Google Brain )研究小组。 该团队已经建立了1000多个深度学习项目,在过去几年中,youtube、翻译、photos等许多谷歌产品的性能有了很大的提高。 利用深度学习技术,研究人员可以将大量数据输入到称为神经互联网的软件系统中,这些神经互联网比人类更早地识别大量新闻的模式。
在接受《财富》杂志采访时,谷歌布莱恩的联合创始人兼领袖之一杰夫? 迪恩( jeff dean )论述了最先进的ai研究,其中涉及的课题,以及ai在产品中的应用。
以下是采访的顶拷贝。
研究者在推进人工智能方面面临着什么挑战?
人类的学习大多来源于没有监督的学习,人们只关注周围的世界,理解周围事物的表现。 机器学习虽然活跃积极,但相关问题尚未得到彻底处理。 因为这还不属于监督学习的范畴。
无监督学习是指通过注意和感知进行学习,如果计算机能自己注意和感知,对处理更多复杂的问题有帮助吗?
人类的视觉首先是通过无监督学习的方法来训练的。 一个孩子注意世界的时候,有时会接到监督式的信号,别人会说“这是长颈鹿”或者“这是车”。 孩子的内心世界自然会对他得到的少量监视式数据做出反应。
我们需要对监督学习和非监督学习展开越来越多的组合操作。 但是,在目前很多机器学习系统的情况下,我们还没有实际实现那个阶段。
强化学习 参考学习名为/ S2// S2/]
强化学习背后的理论是,在不知道接下来会采取什么样的行动时,首先采取你认为可以执行的行动,注意其结果,探索一系列行动可能产生的结果。 例如,在棋盘游戏中,在对对方的棋步做出反应之后,最终经过一系列的训练,可以得到某种报酬信号。
加强学习是将报酬和责备与你所做的一切行为相关联,并逐步获得报酬信号。 现在,在一些行业,这项技术确实有效。
强化学习面临的课题是可能采取的行动范畴相当广泛。 在现实生活中,人类会采取各种各样的行动。 棋盘游戏中,可打的手有限,游戏规则起到一定的制约作用,奖励信号也很清晰。 是赢还是输。
以研磨一杯咖啡为目标,可以采取的行动有很多可能性,奖励信号并不是很确定。
但是,可以清晰地分解步骤。 例如,磨咖啡时,如果在提取前不完全磨咖啡豆,泡的咖啡的味道可能会变坏。
加强学习往往需要探索。 因为将其应用于物理环境有点困难。 我们开始尝试将这项技术应用于机器人。 如果机器人必须采取某种行动,它将受行为类型的限制。 在计算机模拟中,我们利用大量的计算机可以得到几百万个案例,应用起来变得容易了。
谷歌是否在核心搜索产品中纳入了强化学习技术?
谷歌在核心产品上的应用强化学习主要是通过Deep mind (谷歌去年收购的ai初创企业)与数据中心操作员的合作实现的。 他们利用强化学习安装了数据中心的空调节旋钮,大大节约了功耗。 通过加强学习技术,可以探索如何有效地设置旋钮,以及用不同的方法转动旋钮时需要如何应对。
通过加强学习,员工发现这18个旋钮可以这样安装,但迄今为止我并不这么认为。 而且,这个设定看起来很奇怪,但事实上起了相当好的作用。
强化学习适合应用于什么任务?
在上述例子中,强化学习技术的旋钮设定方案发挥了很好的作用。 这是因为每次可以执行的操作很少。 只有18个旋钮。 把手举起来放下就行了。 结果很容易注意到。 在适当的温度范围内,如果电力采用率得到改善,就可以得到奖励信号。 从这个角度来看,这几乎可以说是理想的强化学习的例子。
更麻烦的例子,可能是对检索展示结果的应用。 对于各种查询请求,可见的搜索演示结果比旋钮设置要广泛得多,并且报酬信号有点困难。 无法评估客户对搜索演示的结果是否满意。
如果客户对搜索结果不满意,如何提供奖励信号?
这有点麻烦。 这说明强化学习还不成熟,无约束、奖励信号不太明显的环境下实现真正的动作还不够。
在将研究成果应用于人们每天采用的实际产品时,你们面临着那些最严峻的挑战吗? [/s2/]
许多机器学习处理方案和对它们的处理方案的研究可以在不同的行业重新采用。 例如,我们和地图小组合作开始了一点研究。 他们希望读取街景中出现的所有商业名称和标志,更好地了解街道的具体环境。 例如,这条街上开着披萨店,还是其他什么样的店?
说明为了在街景中识别副本,可以提供围绕副本的样本数据,训练机器学习系统,形成检测图像副本像素的行为模式。
这是一般功能,地图小组可以使用这个功能分解卫星图像。 例如,用于识别美国和世界各地的屋顶,推测太阳能电池板的安装位置。
同样的模型也可以用于医学图像的分解。 例如,分解医疗图像,找出图像中的临床相关新闻。 (灵越) )
来源:UI科技日报
标题:“谷歌大脑负责人谈人工智能:科幻变现实”
地址:http://www.ulahighschool.com/uiitzx/4120.html