#

vision-and-language-navigation

Here are 22 public repositories matching this topic...

eric-ai-lab / awesome-vision-language-navigation

A curated list for vision-and-language navigation. ACL 2022 paper "Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions"

navigation vision-and-language embodied-agent vision-and-language-navigation

Updated May 2, 2024

daqingliu / awesome-vln

A curated list of research papers in Vision-Language Navigation (VLN)

computer-vision awesome-list arxiv papers natural-language-understanding vision-and-language vision-and-language-navigation

Updated Apr 17, 2024

YicongHong / Recurrent-VLN-BERT

Code of the CVPR 2021 Oral paper: A Recurrent Vision-and-Language BERT for Navigation

transformer bert vision-and-language pre-trained-model vision-and-language-navigation cvpr-oral cvpr2021

Updated Aug 13, 2022
Python

YicongHong / Discrete-Continuous-VLN

Code and Data of the CVPR 2022 paper: Bridging the Gap Between Learning in Discrete and Continuous Environments for Vision-and-Language Navigation

computer-vision deep-learning visual-navigation vision-and-language vision-and-language-navigation embodied-ai cvpr2022

Updated Oct 31, 2023
Python

GT-RIPL / robo-vln

Pytorch code for ICRA'21 paper: "Hierarchical Cross-Modal Agent for Robotics Vision-and-Language Navigation"

python language deep-neural-networks computer-vision deep-learning robotics navigation transformers pytorch artificial-intelligence supervised-learning bert vision-and-language vision-and-language-navigation habitat-api habitat-sim

Updated Jun 27, 2024
Python

YicongHong / Entity-Graph-VLN

Code of the NeurIPS 2021 paper: Language and Visual Entity Relationship Graph for Agent Navigation

deep-learning graph-neural-networks vision-and-language-navigation neurips-2021

Updated Oct 31, 2021
Python

YicongHong / Fine-Grained-R2R

Code and data of the Fine-Grained R2R Dataset proposed in the EMNLP 2021 paper Sub-Instruction Aware Vision-and-Language Navigation

vision-and-language-navigation

Updated Oct 26, 2021
Python

CrystalSixone / VLN-GOAT

Repository for Vision-and-Language Navigation via Causal Learning (Accepted by CVPR 2024)

vision-and-language-navigation

Updated Nov 1, 2024
Python

Feliciaxyao / ICML2024-FSTTA

Fast-Slow Test-time Adaptation for Online Vision-and-Language Navigation

vision-and-language-navigation test-time-adaptation

Updated Oct 15, 2024
Python

joeyy5588 / planning-as-inpainting

Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty

task-planning object-manipulation vision-and-language-navigation embodied-ai

Updated Dec 11, 2023
Python

raphael-sch / map2seq_vln

Code for ORAR Agent for Vision and Language Navigation on Touchdown and map2seq

vision-and-language touchdown embodied-agent street-view vision-and-language-navigation vln map2seq

Updated Nov 3, 2023
Python

PrithivirajDamodaran / vision-language-modelling-series

Companion Repo for the Vision Language Modelling YouTube series - https://bit.ly/3PsbsC2 - by Prithivi Da. Open to PRs and collaborations

multimodal-interactions vision-and-language multimodal-deep-learning multimodal-representation vision-and-language-navigation vision-and-language-pre-training

Updated Aug 16, 2022
Jupyter Notebook

eric-ai-lab / FedVLN

[ECCV 2022] Official pytorch implementation of the paper "FedVLN: Privacy-preserving Federated Vision-and-Language Navigation"

federated-learning privacy-preserving-machine-learning vision-and-language-navigation

Updated Oct 8, 2022
C++

xyz9911 / FLAME

FLAME: Learning to Navigate with Multimodal LLM in Urban Environments (arXiv:2408.11051)

embodied-agent vision-and-language-navigation vision-language-model multimodal-large-language-models large-multimodal-models

Updated Aug 21, 2024

batra-mlp-lab / vln-chasing-ghosts

Code for 'Chasing Ghosts: Instruction Following as Bayesian State Tracking' published at NeurIPS 2019

vision-and-language neurips neurips-2019 vision-and-language-navigation vln

Updated Jan 10, 2020
C++

joeyy5588 / LACMA

LACMA: Language-Aligning Contrastive Learning with Meta-Actions for Embodied Instruction Following

vision-and-language-navigation embodied-ai

Updated Dec 3, 2023
C

tsujuifu / model_aps

Models of APS

computer-vision pytorch vision-and-language-navigation eccv2020

Updated Jun 19, 2023

marialymperaiou / knowledge-enhanced-multimodal-learning

A list of research papers on knowledge-enhanced multimodal learning

knowledge-graph multi-task-learning visual-reasoning visual-dialog visual-question-answering vision-and-language multimodal-deep-learning visual-storytelling multimodal-retrieval visual-grounding visual-commonsense-reasoning vision-and-language-navigation story-visualization image-text-matching vision-language-transformer image-text-retrieval vision-and-language-pre-training conditional-image-generation knowledge-enhanced-multimodal-learning knowledge-enhanced-vision-language

Updated Dec 8, 2022

intelligolabs / R2RIE-CE

Official repository of "Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation". We present the first dataset - R2R-IE-CE - to benchmark instructions errors in VLN. We then propose a method, IEDL.

vision-and-language-navigation vln embodied-ai

Updated Aug 3, 2024
Python

eric-ai-lab / Naivgation-as-wish

Official implementation of the NAACL 2024 paper "Navigation as Attackers Wish? Towards Building Robust Embodied Agents under Federated Learning"

robustness attack-defense federated-learning embodied-agent vision-and-language-navigation

Updated Apr 10, 2024
Python

Improve this page

Add a description, image, and links to the vision-and-language-navigation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the vision-and-language-navigation topic, visit your repo's landing page and select "manage topics."