MIT 协助机器人精确识别重要物体
SearchTechritual 香港科技电脑资讯网站
公告查询FacebookInstagramTwitterVimeoYoutubeTechritual 香港科技电脑资讯网站 NEWSThe Price 价钱 / 优惠手机 Mobile 手机小米 15 在 Geekbench 测试中表现出色,搭载 Snapdragon 8 Elite 处理器及 Android 15 系统Mobile 手机Qualcomm Snapdragon 8 Elite 与 MTK Dimensity 9400 CPU 比较:MTK 这次超越了 Qualcomm 了吗?Mobile 手机Samsung S25 系列传闻将全面采用 Snapdragon 处理器Mobile 手机ARM 终止高通(Qualcomm)晶片设计许可,影响深远。Mobile 手机Arlo 推出首款 Wired Floodlight Camera,US$149.99SIM Card AllSIM Card 储值卡评测比较年卡旅游 SIM 卡台湾电话卡日本电话卡泰国电话卡澳洲电话卡月卡SIM Card 电话储值卡【实测 2024】日本电话卡 推介|4G/5G 上网卡 6 款比较|东京 大阪 褔冈 开箱 贪平会出事,有 5G 用啦!NEWS【实测 2024】韩国电话卡推介:4 款旅游卡,有无限上网,有打电话,首尔、釡山测速!4G /5G 速度差异明显SIM Card 开箱评价【评价】台湾 电话卡 – B4travel 5G $168 12日 20GB 无限上网,高速达 147MbpsSIM Card 储值卡评测比较【评测】abc Mobile↷csl $150 120GB 本地储值年卡,速度测试约 39MbpsTelecom 电讯Wearable Wearable TechnologyMeta Quest 3 新增 HDMI Link 应用程式,提升多功能性与连接选择!Wearable TechnologyVision Pro 模拟器重新带回任天堂 Virtual Boy 的经典游戏体验Wearable TechnologyDisney+ 推出其为 Apple Vision Pro 设计的第五个沉浸式环境Wearable Technology新突破将串联 OLED 技术应用於微型 OLED,为 Vision Pro 2 提供完美解决方案。Wearable TechnologyPixel Buds Pro 2 泄漏显示硬体升级及受 AirPods 启发的设计变更VPN Trending 流行【说明】Proton VPN vs NordVPN:私隐更好?免费选择?跨国串流最佳?VPN【整理】如何在 Apple TV 安装使用 VPN!Others【详解】VPN 是什麽?选择、推荐及「免费」服务介绍 2024VPN【教学说明】如何在 iPhone (iOS 17) 上设定 VPNVPN【详解】如何为 iPhone 选择 VPN?私隐、无日志政策、易用、速度,5 个 VPN 服务供应商推介开箱评测 AllSIM Card 开箱评价充电器 开箱评价手机平板 开箱评价配件 开箱评价配件 开箱评价【开箱评价】momax Cord 电话背带配件 开箱评价【开箱评价】Catalyst iPhone 16 Influence 手机保护壳,支援 MagSafe 版本配件 开箱评价【开箱评价】Catalyst iPhone 16 Influence 手机保护壳配件 开箱评价【开箱评价】momax 1-Wallet 磁吸卡片套支架比较系列手机比较网速测试StockARMGFSGOOGHPQINTCIRDMNVDAQCOMSOUNTSMCVZVODSearch
AI – Artificial intelligence – 人工智能评测:SK hynix Beetle X31 可携式固态硬碟 SSDMIT 协助机器人精确识别重要物体24/10/2024 Henderson129
在整理一个凌乱的厨房时,可能会从满是酱料包的台面开始。如果目标是将台面清理乾净,可能会将所有酱料包一起扫走。然而,若想先挑出芥末酱包再丢掉其他的,则需要根据酱料类型进行更精细的分类。如果在芥末中有一包 Grey Poupon,寻找这个特定品牌则需要更仔细的搜寻。
麻省理工学院的工程师们开发了一种方法,使机器人能够做出类似直观且与任务相关的决策。该团队的新方法名为 Clio,能让机器人根据手头的任务识别场景中重要的部分。透过 Clio,机器人接收用自然语言描述的任务清单,并基於这些任务确定解释其周围环境所需的细致程度,并“记住”场景中相关的部分。
在从凌乱的办公室到麻省理工学院校园内的五层楼建筑的实验中,该团队利用 Clio 根据自然语言提示(如“移动杂志架”和“取急救包”)自动将场景分割为不同的细致程度。该团队还在一台四足机器人上实时运行 Clio。当机器人探索一栋办公楼时,Clio 只识别和绘制与机器人任务相关的场景部分(例如在忽略办公用品堆的情况下取回狗玩具),使机器人能够抓取感兴趣的物体。
Clio 的名称源自希腊历史女神,因其能够识别和记住与特定任务相关的元素。研究人员预见,Clio 在许多情况和环境中都能发挥作用,帮助机器人快速调查并理解其周围环境。
“搜寻和救援是这项工作的主要应用,但 Clio 也可以为家庭机器人和在工厂与人类协作的机器人提供支持,”麻省理工学院航空航天系副教授、信息与决策系统实验室负责人及麻省理工学院 SPARK 实验室主任 Luca Carlone 表示。“这实际上是帮助机器人理解环境以及它需要记住什麽,以便执行其任务。”
该团队在今天发表於《机器人与自动化快报》的研究中详细介绍了他们的成果。Carlone 的共同作者包括 SPARK 实验室的成员 Dominic Maggio、Yun Chang、Nathan Hughes 和 Lukas Schmid;以及麻省理工学院林肯实验室的成员 Matthew Trang、Dan Griffith、Carlyn Dougherty 和 Eric Cristofalo。
随着计算机视觉和自然语言处理领域的巨大进展,机器人能够识别周围的物体。但直到最近,机器人仅能在“封闭集”场景中工作,这些场景经过精心策划和控制,并且机器人只能识别有限数量的预训练物体。
近年来,研究人员采取了“开放”方法,使机器人能够在更现实的环境中识别物体。在开放集识别领域,研究人员利用深度学习工具构建神经网络,处理来自互联网的数十亿张图像及其相关文本(例如朋友的 Facebook 图片,配文为“见我的新小狗!”)。
通过数百万对图像-文本,神经网络可以学习并识别场景中某些术语的特徵(例如狗)。然後,机器人可以应用该神经网络在全新场景中找到狗。然而,如何以对特定任务有用的方式解析场景仍然是一个挑战。
“典型方法会随机选择一个固定的细致程度来确定如何将场景的部分融合成一个‘物体’,”Maggio 表示。“然而,所谓的‘物体’的细致程度实际上与机器人必须做的事情有关。如果这个细致程度是固定的,未考虑任务,则机器人可能会得到一个对其任务无用的地图。”
利用 Clio,麻省理工学院的团队旨在使机器人能够以可以自动调整的细致程度来解释其周围环境。例如,给定将一叠书籍移动到架子上的任务,机器人应能够确定整叠书籍是与任务相关的物体。同样,如果任务是仅从堆叠中移动绿色书籍,机器人应将绿色书籍区分为单一目标物体,并忽略其他场景,包括堆叠中的其他书籍。
该团队的方法结合了最先进的计算机视觉和大型语言模型,这些模型由神经网络组成,能在数百万张开源图像和语义文本之间建立联系。他们还整合了映射工具,自动将图像分割为许多小部分,这些部分可以输入神经网络以确定某些部分是否在语义上相似。研究人员利用经典信息理论中的一个概念“信息瓶颈”,以压缩多个图像部分,挑选和存储与特定任务最相关的部分。
“例如,假设场景中有一堆书籍,而我的任务只是取出绿色书籍。在这种情况下,我们将所有有关场景的信息通过这个瓶颈,最终得到一组代表绿色书籍的部分,”Maggio 解释说。“所有不相关的部分会被分组在一起,我们可以简单地移除它们。这样,我们就能得到需要的正确细致程度的物体,以支持我的任务。”
研究人员在不同的现实环境中展示了 Clio 的应用。“我们认为在我未事先清理的公寓中运行 Clio 是一个非常实际的实验,”Maggio 表示。该团队制定了一系列自然语言任务,如“移动衣物堆”,然後将 Clio 应用於 Maggio 的凌乱公寓的图像。在这些情况下,Clio 能够快速分割公寓的场景,并通过信息瓶颈算法识别出构成衣物堆的部分。
他们还在波士顿动力公司的四足机器人 Spot 上运行 Clio。给机器人一系列任务後,当机器人探索并绘制办公楼的内部时,Clio 在安装在 Spot 上的计算机上实时运行,以挑选与给定任务视觉相关的部分。该方法生成了一个覆盖地图,仅显示目标物体,机器人然後利用该地图接近已识别的物体并实际完成任务。
“在实时运行 Clio 是团队的一个重大成就,”Maggio 表示。“许多之前的工作需要几个小时才能运行。”
展望未来,该团队计划调整 Clio,使其能够处理更高级的任务,并在最近的逼真视觉场景表示方面取得进展。“我们仍然给 Clio 一些相对具体的任务,例如‘找扑克牌’,Maggio 表示。“对於搜寻和救援,您需要给它更高级的任务,例如‘寻找幸存者’或‘恢复电力’。因此,我们希望能够达到更接近人类的理解,以完成更复杂的任务。”
这项研究部分得到了美国国家科学基金会、瑞士国家科学基金会、麻省理工学院林肯实验室、美国海军研究办公室以及美国陆军研究实验室分布式和协作智能系统及技术合作研究联盟的支持。
B4travel 5G 日本电话卡 9日 10GB 无限上网 / B4travel 5G 台湾电话卡 8日 20GB 无限上网
日本电话卡推介 / 台湾电话卡推介
更多储值卡评测请即睇:SIM Card 大全
https://www.techritual.com/category/sim-card-review/
此文章发布於 TechRitual 香港 – 日本电话卡 – 台湾电话卡 – 韩国电话卡
HendersonHenderson 主要担任「炒稿记者」的职责,以翻译最新科技,手机 电动车等消息为每天的工作。 【售价】EZVIZ T10C 漏水感应器 ,最新售价 $ 89【评测】日本电话卡 中国联通 8天 6GB,最好避开的上网卡【手机比较】honor X60 与 honor X9b:规格表、效能、摄影功能【SIM Card】香港最平 ∞GB 无限上网最抵「月」电话储值卡大整理【实测 2024】台湾电话卡推介:唔一定要「实名登记」,台北、桃园、中坜测速!最快可以去到 135Mbps【开箱评价】honor Magic V3:更薄更轻,有 Google 有 AI,愈来愈有竞争力【开箱评价】CMF Phone 1 手机:中低阶但有组件元素劲吸引
电话卡储值卡评测年卡 香港月卡 香港旅游 SIM 卡日本电话卡台湾电话卡中国大陆 电话卡澳门电话卡泰国电话卡比较系列手机比较Stockarm (ARM)GLOBALFOUNDRIES (GFS)Google (GOOG)HP (HPQ)Intel (INTC)Iridium Communications (IRDM)NVIDIA (NVDA)Qualcomm (QCOM)SoundHound (SOUN)TSMC (TSMC)Verizon (VZ)Vodafone (VOD)推荐内容开箱评测评论分析科技知识教学 101电子门锁 101Router 路由器 101关於我们关於 Techritual活动公告香港网速测试Techritual 香港River