拇指任务(Thumb Task)是一种基于深度强化学习的任务,旨在通过让代理模型使用其手指来操作一个虚拟环境来完成特定任务。在这个任务中,代理模型必须学会在有限的空间内快速、有效地移动手指,并且能够根据场景的需要灵活地切换手指的位置。

大拇指任务系统-拇指任务

拇指任务最初是由Google DeepMind团队提出的,他们在2015年发表了一篇关于拇指任务的研究论文。这项研究的结果表明,通过深度强化学习,代理模型可以学会履行各种复杂的任务,包括抓取物体、按按钮等。

拇指任务的主要挑战在于它的实时性要求。由于任务是在虚拟环境中进行的,因此代理模型需要在极短的时间内作出反应并采取行动。由于任务的目标和环境都是随机变化的,所以代理模型也需要能够适应不同的情况。

拇指任务是一个非常有趣和具有挑战性的任务,它可以帮助我们更好地理解深度强化学习的潜力,并为我们提供一个新的方法来训练智能体在复杂环境中履行任务。

大拇指代表什么意思

竖大拇指的手势,几乎在世界公认表示好、高、妙、一切顺利、非常出色等类似的信息。

美国和欧洲部分地区,竖大拇指通常用来表示搭车;在尼日利亚这种手势被认为是侮辱性手势;在德国则代表数字1;在日本表示数字5;在澳大利亚则表示骂人。

扩展资料

手的作用

在哺乳动物中,人类的手独一无二。大拇指同其他4个手指相对的结构是人手的最大优越性,许多类人猿可以将自己的拇指和食指对合,但不能将拇指与中指、无名指以及小指对合,因为它们的手指不够柔韧。只有人类,可以自如地运用自己的手指,这是人类文化和科技进步的关键。

人类的手指十分灵敏,可以感觉到振幅只有0.00002毫米的振动。人们也习惯于在说话的同时比比划划,或者完全用手势来表达感情。

原始人类曾经用全身各个部位的肢体语言进行交流,在有了口头语言之后,最初的肢体语言都逐渐被淘汰,除了手势。研究发现,在说话时做手势有助于思考、表达和记忆。

参考资料来源百度百科-大拇指

上图中的场景在战争片中经常可以看到,一般做出这样的动作,接下来就是一阵猛烈的炮击,而且可以精确的打击到目标物。

而一般使用这种方法就是为了测量目标物的距离,所使用的攻击武器为迫击炮,一种能够发射弧线炮弹的武器。

一般迫击炮的发射炮弹的初始速度是一样,所以可以通过调节迫击炮的发射角度,就可以准确的知道炮弹的落点。

这个出厂的时候就已经计算好了,什么样的角度能打到多远的距离,都有详细说明。

那么目标的物体的距离呢?这就需要在实战中根据具体的情况进行测量。

而我们在战争片中看到的伸个拇指就是在测量目标物的距离,这种方法称为眼跳法测距,其实基本原理跟我们天文学上最基本的视差法是一样的。

这个方法能够测距的原因是,我们有两只眼睛,并且它们之间有一定的距离,还有一点就是光线沿着直线传播。

现在你身处你伸出你的手臂,并且竖起拇指,放在你眼前的任何位置,然后轮流闭上左右眼睛,你就会看到拇指的位置会落在远处参考物不同的位置上。

这种左右眼看到物体位置的不同,就是我们所说的视差,而测距正是依靠视差来进行的。接下来我们就说下拇指测距的原理。

如果你是一个迫击炮手,现在要准确的打击到远处的目标物,那么你就要知道目标物和你的距离,然后根据这个距离调节迫击炮的角度。

接到命令以后,你只需要伸出你的右臂,然后竖起大拇指,但这是你不能把大拇指放在眼前的任何位置的,而是要让你的拇指和右眼保持在一条直线上,并且和目标物对齐。

这个很简单,光线沿直线传播,两点一线你很容易能够对齐。就像上图那样,右眼、拇指、目标。

对齐以后手臂不要动,保持稳定,现在闭上右眼,睁开左眼,你就会看到手指落在了其他位置上。就像上图中的左眼、拇指和远处的任何参照物。

完成以上的操作,你就瞬间在空间中构建起了两个相似三角形。

求解这个三角形的任何边长角度,都是简单的几何知识了,初中就可以完成。上图就可以看到其实我们要知道的是Y的距离。也就是你和目标的距离,再准确一点就是再加上你手臂的距离。

上图中两个相似三角形顶角是相等的,所以我们就能写出X/Y=A/B。

那么Y=XB/A。其中A就是你瞳孔之间的距离,B就是你手臂的距离,X就是视差偏移的距离,其中A、B这两个量是已知的,作为一个优秀的炮手,你早就对你的身体的参数了如指掌。

如果你是个新手,身材与大部分人不相上下,你也可以利用大多数人的参数,B/A大约等于10。

最难的地方就是你如何确定X,这就是一个优秀炮手和一个垃圾炮手的区别所在了。

如果你要攻击别人的一辆坦克,拇指对准坦克的头部,然后左眼看见拇指偏移到了背景的右边,坦克的长度是已知的,那么你就应该根据经验估算出偏移的距离能够放几个坦克,并且知道偏移量X是多少。

如果你要攻击敌人的碉堡,首先应该掌握敌人碉堡的尺寸,然后把拇指对准碉堡的一个遍,睁开左眼,就会看到拇指偏移,然后根据碉堡的尺寸进而估计出偏离的距离。

这就是要你拥有丰富的实战经验,但是对于一个老手来说,就是瞬间完成的事。非常简单。

那么天文学上的视差法怎样测量星星的距离呢?

和迫击炮手的原理相同,但方法不同。

视差法有个特点,就是拇指距离你双眼越近,那么你交替双眼观察拇指的时候,拇指相对于远处固定的背景偏移的量就越大。

现在你伸出手臂,这回伸出一半,试着看下拇指,然后再把手臂伸直再看,你就会发现区别。

那么要是我们看非常遥远的一个树木、山头呢?你就会发现,就算你交替双眼,已经很难分辨出两者之间位置的偏差了。

这是因为这些物体离你太远,也是因为你的两个瞳孔之间的距离太近了。所以你想要在原地站着测量天体的距离是不可能的了。

例如利用视差法测量月球的距离,就要在两个相隔数千公里的地方,分别观察月球,然后测量出月球相对于恒星背景在天空中偏移的距离。根据这个距离在天空中所占的角度大小,就能知道这次测量的视差角。

我们知道了等腰三角形的顶角,知道了它的底边长度,很容易就能算出月球距我们的距离。

月球还相对较近一些,但是想要测量遥远的恒星,就算是把地球的直径当作基线,也很难看出某一刻横向相对于整个恒星背景的偏移,那怎么办?

我们把地球绕太阳的轨道直径当作了基线,首先在1月份的时候某一个特定的时间观察目标恒星的位置,然后再六月份地球转到绕太阳轨道另一边的时候,再在同一时间测量这颗恒星再天空中的位置。

根据这个位置的偏差我们就能知道以地球轨道直径为底边的等腰三角形的顶角是多少,然后简单的三角函数算出这颗恒星距我们的距离。

非常简单,这种方法的局限性非常大,因为地球的轨道直径是我们能够用到最长的基线了。所以这种方法测量恒星距离的范围非常有限,一般就能测个银河系内的恒星和天体。

现在我们已经很少用视差法测量天体的距离了,而且在更加遥远的地方我们可以通过变星的周光关系、超新星等一系列方法可以测算出数百亿光年的距离。

但是简单的几何关系,在人类历史上的测距问题上发挥了重大的贡献,在历史上人类首次的天体、天文测距任务都是通过几何方法算出来的。

例如公元前3世纪的埃拉托色尼就利用几何通过定量的方法知道了地球是个球,并且算出了地球的周长;

也在同一时期,古希腊学者阿里斯塔克斯通过简单的几何首次为人类算出了月球以及太阳的距离,虽然不准确,但也算得上是一次科学史上的壮举。

小小的拇指测距,小小的迫击炮发射前的动作,其实也包含着深刻的科学。它也是天文学发展的基础。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。