valan:视觉和语言代理导航

时间:2024-06-13 19:47:10
【文件属性】:

文件名称:valan:视觉和语言代理导航

文件大小:14.08MB

文件格式:ZIP

更新时间:2024-06-13 19:47:10

Python

VALAN:视觉和语言代理导航 VALAN是“视觉和语言代理导航”的缩写,是一种轻量级且可扩展的软件框架,用于基于架构的深度强化学习。 该框架有助于解决接地语言理解任务,如视觉和语言导航和视觉和对话框导航,在照片般逼真的环境,如发展和体现剂的评价和 。 这样的任务需要代理解释自然语言指令/对话以在逼真的环境中进行导航,以实现规定的导航目标。 我们在SEED RL的基础上添加了最少的抽象集,使我们能够概括该体系结构以解决各种其他RL问题。 该软件包包含以下问题的实现: Matterport3D环境中R2R数据集上的VLN任务() Matterport3D环境中CVDN数据集的NDH任务() StreetLearn环境中的Touchdown数据集上的SDR和VLN任务() 参见 详细了解我们对Touchdown的实现及其支持的数据。 有关体系结构的详细说明,请阅读。 如果您在工作中


网友评论