Vis. Intell. - researchr journal

researchr

You are not signed in
Sign in
Sign up

Xinyu Xiong, Zihuang Wu, Shuangyi Tan, Wenxue Li 0003, Feilong Tang, Ying Chen, Siying Li, Jie Ma, Guanbin Li. SAM2-UNet: segment anything 2 makes strong encoder for natural and medical image segmentation. Vis. Intell., 4(1), 2026.
Zhenghao Chen, Nan Zhou, Yi Fan, Lina Zhou, Yubao Xie, Jiaxin Chen 0002, Di Huang 0001. DAS-SAM: fine-tuning SAM towards drivable area segmentation via efficient multi-scale traffic scene-aware adaptation. Vis. Intell., 4(1), 2026.
Shengkun Zhu, Chengcheng Guo, Yuanji Lu, Zhehao Shen, Yize Wu, Yu Hong, Yiwen Cai, Meihan Zheng, Yingliang Zhang, Lan Xu 0003, Jingyi Yu 0001. A general framework for Gaussian Splatting-based human-centric volumetric videos. Vis. Intell., 4(1), 2026.
Yongqi Shan, Yunzhi Zhuge, Huchuan Lu. HDVS: semi-supervised semantic segmentation via heterogeneous dual-branch voting supervision. Vis. Intell., 4(1), 2026.
Ganlong Zhao, Guanbin Li, Yizhou Yu. NavGemini: a multi-modal LLM agent for vision-and-language navigation. Vis. Intell., 4(1), 2026.
Hongsong Wang 0001, Wenjing Yan, Qiuxia Lai, Xin Geng 0001. Temporal consistency-aware text-to-motion generation. Vis. Intell., 4(1), 2026.
Junlin Xie, Zhihong Chen, Ruifei Zhang, Guanbin Li. Correction: Large multimodal agents: a survey. Vis. Intell., 4(1), 2026.
Hao Shen 0006, Xiaofeng Cong, Henghui Ding, Yulun Zhang 0001, Xudong Jiang 0001. Efficient image dehazing with synergic expert modulation. Vis. Intell., 4(1), 2026.
Chengcheng Song, Hui Li 0037, Tianyang Xu 0001, Xiao-Jun Wu 0001, Josef Kittler. RefineFuse: an end-to-end network for multi-scale refinement fusion of multi-modality images. Vis. Intell., 3(1), 2025.
Haonan Cheng, Hanyue Liu, JuanJuan Cai, Long Ye. CLFormer: a cross-lingual transformer framework for temporal forgery localization. Vis. Intell., 3(1), 2025.

runs on WebDSL