RxR:Room-across-Room(RxR)是Matterport3D环境中用于视觉和语言导航(VLN)的大规模多语言数据集。 它包含英语,印地语和泰卢固语的126k导航说明,并在演示后显示126k导航。 两种注释类型都包括文本和注释者的视觉感知之间的密集时空对齐

时间:2024-05-28 04:34:00
【文件属性】:

文件名称:RxR:Room-across-Room(RxR)是Matterport3D环境中用于视觉和语言导航(VLN)的大规模多语言数据集。 它包含英语,印地语和泰卢固语的126k导航说明,并在演示后显示126k导航。 两种注释类型都包括文本和注释者的视觉感知之间的密集时空对齐

文件大小:19.69MB

文件格式:ZIP

更新时间:2024-05-28 04:34:00

HTML

跨房间(RxR)数据集 Room-Across-Room(RxR)是用于环境的(VLN)的多语言数据集。 与“(R2R)”等相关数据集相比,RxR大10倍,多语言(英语,北印度语和泰卢固语),并且路径越来越长,并且包含与每个单词相关的细粒度视觉基础到环境中的像素/表面。 RxR以gzip 和发布,并具有四个组件:引导注释,关注者注释,姿势跟踪和文本功能。 单独的指南注释类似于R2R,足以运行标准VLN设置。 参考 RxR数据集在“。 Bibtex: @inproceedings{rxr, title={{Room-Across-Room}: Multilingual Vision-and-Language Navigation with Dense Spatiotemporal Grounding}, author={Alexander Ku and Peter Anders


【文件预览】:
RxR-main
----visualizations()
--------scan_to_mesh.json(5KB)
--------first_person.gif(12.29MB)
--------setup.py(4KB)
--------README.md(2KB)
--------first_person.html(5KB)
----LICENSE(18KB)
----README.md(12KB)
----merged-large.gif(11.3MB)

网友评论