进化版“擎天柱”来了!或将引领人工智能下一浪潮
2023-06-13 21:07:17   来源:   评论:0 点击:

       5月16日,在特斯拉的股东日上,依旧没有发布新车,但马斯克官宣,新车的年销量一定超过500万,许诺赛博皮卡将在今年内一定来。马斯克花大量篇幅阐述了机器人“Optimus”,对市场空间广阔畅想,并表达了对特斯拉人形机器人上的信心。甚至认为未来特斯拉的长期价值将主要来自人形机器人,“未来每个人都将拥有人形机器人,有些人甚至不止一个,这个市场将是百亿级别的”

“Optimus”有哪些变化?学会行走并会抓取物品

  与左图去年特斯拉AI日上所展示的PPT般宣传质感不同:公布的未包装的“擎天柱”原型机,走路都还不稳;而今年的“擎天柱”可以5个同时向前走路。

  并且,已经被投放到赛博皮卡的车间中,执行简单的任务。

  此外,相比上一次亮相,Optimus在电机扭矩和力度控制等方面更精确,还能探索和记忆环境,比如记得自己走过的路,走路姿态也更自然。如下图:

  通过使用车载摄像头和一套传感器,擎天柱还能够探索和记忆环境,为在指定区域工作做好准备。

  擎天柱能够用双手处理复杂任务。可以说,这是当前人形机器人最难做到的一部分。

技术上,Optimus有所突破关键在于“和FSD算法打通”

  马斯克表示,特斯拉迄今为止是所有科技公司中“拥有最先进的现实世界人工智能”的公司。为此,特斯拉已经试图打通电动汽车的辅助驾驶软件(FSD)系统和人形机器人的底层模块。也就是说,产业链正在积极配套特斯拉机器人。

  特斯拉的FSD算法指的是其全自动驾驶(Full Self-Driving)系统所采用的算法。可实现车辆的自主导航和自动驾驶功能,让车辆能够在各种交通环境下进行感知、决策和控制。马斯克称,大量的特斯拉电动车已经能够观察并理解周围的世界,且能够根据采集到的信息进行决策。而利用特斯拉在计算机视觉方面的技术进步,未来也能够对人形机器人进行进一步的部署。

  许多人都会拿波士顿动力机器人与其作比较。两者不同之处在于,特斯拉机器人的核心是人工智能,分为三个部分:输入部分、中间计算平台部分和输出部分。特斯拉机器人主要做前两部分。波士顿机器人最强的地方,就在于输出环节,既有执行环节,也有感知环节。

  外媒Electrke估计,Optimus距离有用的产品应该还有3年时间的路要走。

  但从今年的活动中来看,马斯克对于Optimus的态度依旧是乐观且坚持,他首次这样表态:通用型AI算法支持的机器人,是特斯拉未来长期价值所在。

  除此之外,马斯克还大胆地预测说:如果Optimus成熟可用了,届时很多人都希望能够拥有一台或多台,那么它们的数量可能将达到100亿甚至200亿!

  将引领人工智能下一浪潮?

  近年来,业界一直在研究行走机器人,无论是日本本田的阿西莫,还是深圳的优必选,乃至波士顿动力,都无法解决人体的柔韧性和平衡性这一基础问题。

  机器人的两只手要比两只脚的两只手要困难得多。到目前为止,还没有一只机器人能够像人的手指一样灵活,这一直是工业界和学术界面临的一个难题。

人形机器人是一条好的发展道路吗?

  实用机器人外表不一定具备人形,可量身定做一只机械臂,比如拿着玻璃,拿着金属,只要能做到这一点,就足够了。至于脚,是否一定和人类一样具备行走能力?其实也不一定,比如说希腊传说中的半人半马,除了拥有四条腿的稳定之外,还拥有两条柔韧的胳膊,可以用来做一些任务。

  尽管人形机器人现阶段还有很长的道路要走,但是新的AI题材层出不穷,并催生了以“机器人+AI”融合而成的具身智能概念。

  人们对马斯克的人形机器人早已耳熟能详。从最终用途来看,特斯拉人形机器人和具身智能机器人几乎可以划等号。

  从技术上看,具身智能的实现离不开三大环节——感知、想象和执行。这意味着具身智能机器人需要有灵活的头脑、强大的执行力、流畅的与人交流的能力、像人一样的自学能力。

  基于此,机器人产业和多模态大模型、机器视觉技术等被多家机构视作新的掘金方向。未来5-10年,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人等领域得到应用;AI是机器视觉的母身,深度学习为机器视觉的技术堡垒,近期Meta发布SAM模式有望助力机器视觉迎来GPT时刻。此外,苹果、谷歌、亚马逊、微软等科技巨头都已经拥有了智能语音助手系统,具身AI领域正处于快速发展阶段,未来可能会涌现更多的创新和进展。

分享到: