Zhaoxin Fan’s Homepage

2026

CoSE: connectivity-oriented semantic enhancement for mitigating hallucinations in multimodal LLMs
Yuanze Hu, Zhaoxin Fan (corresponding author), Gen Li, Zhichao Yang, Xinyu Wang, Ye Qiu, Wenjun Wu, Kejian Wu, Yifan Sun, Xiaotie Deng, Jin Dong, Ziyu Jia
Information Fusion (IF), 2026.
[Paper] [Code]

MapDream: Task-Driven Map Learning for Vision-Language Navigation
Guoxin Lian, Shuo Wang, Yucheng Wang, Yongcai Wang, Maiyue Chen, Kaihui Wang, Bo Zhang, Zhizhong Su, Deying Li, Zhaoxin Fan (corresponding author)
International Conference on Machine Learning (ICML), 2026.
[Paper] [Code]

Z-Erase: Enabling Concept Erasure in Single-Stream Diffusion Transformers
Nanxiang Jiang, Zhaoxin Fan (corresponding author), Baisen Wang, Daiheng Gao, Junhang Cheng, Jifeng Guo, Yalan Qin, Yeying Jin, Hongwei Zheng, Faguo Wu, Wenjun Wu
International Conference on Machine Learning (ICML), 2026.
[Paper] [Code]

Segment and pick any fruit: Text-prompted robotic harvesting
Zhaoxin Fan, Xiaotong Su, Yanfeng Lu, Yuan Fang, Zeyu Gao, Jungui Feng, Yuanzhe Hu
Pattern Recognition, 2026.
[Paper] [Code]

Inside Out: Evolving User-Centric Core Memory Trees for Long-Term Personalized Dialogue Systems
Jihao Zhao, Ding Chen, Zhaoxin Fan, Kerun Xu, Mengting Hu, Bo Tang, Feiyu Xiong, Zhiyu Li
Annual Meeting of the Association for Computational Linguistics (ACL), 2026.
[Paper] [Code]

PEAP: Proactive Embodied Action Sequence Planning with Joint Understanding of Vision and Audio Perception
Tianwei Lan, Jiaqi Wu, Zeming Liu, Zhaoxin Fan, Haifeng Wang, Yuhang Guo
Annual Meeting of the Association for Computational Linguistics (ACL), 2026.
[Paper] [Code]

TinyAlign: Boosting Lightweight Vision-Language Models by Mitigating Modal Alignment Bottlenecks
Yuanze Hu, Zhaoxin Fan (corresponding author), Xinyu Wang, Gen Li, Ye Qiu, Zhichao Yang, Wenjun Wu, Kejian Wu, Yifan Sun, Xiaotie Deng, Jin Dong
Annual Meeting of the Association for Computational Linguistics (ACL Findings), 2026.
[Paper] [Code]

DeepSynth-Eval: Objectively Evaluating Information Consolidation in Deep Survey Writing
Hongzhi Zhang, Yuanze Hu, Tinghai Zhang, Jia Fu, Tao Wang, Junwei Jing, Zhaoxin Fan, Qi Wang, Ruiming Tang, Han Li, Guorui Zhou, Kun Gai
Annual Meeting of the Association for Computational Linguistics (ACL Findings), 2026.
[Paper] [Code]

ExGes: Expressive Human Motion Retrieval and Modulation for Audio-Driven Gesture Synthesis
Xukun Zhou, Fengxin Li, Ming Chen, Yan Zhou, Pengfei Wan, Yeying Jin, Hongyuan Zhang, Hongyan Liu, Zhaoxin Fan (corresponding author), Jun He, Xuelong Li
IEEE Transactions on Visualization and Computer Graphics (TVCG), 2026.
[Paper] [Code]

Dust to Tower: Coarse-to-Fine Photo-Realistic Scene Reconstruction from Sparse Uncalibrated Image
Xudong Cai, Yongcai Wang, Zhaoxin Fan (corresponding author), Haoran Deng, Shuo Wang, Wanting Li, Deying Li, Lun Luo, Minhang Wang, Hongyuan Zhang, Xuelong Li
IEEE Transactions on Visualization and Computer Graphics (TVCG), 2026.
[Paper] [Code]

HVG-3D: Bridging Real and Simulation Domains for 3D-Conditional Hand-Object Interaction Video Synthesis
Mingjin Chen, Junhao Chen, Zhaoxin Fan(corresponding author), Yujian Lee, Zichen Dang, Yawen Cui, Lap-Pui Chau, Yi Wang, Lili Wang
Conference on Computer Vision and Pattern Recognition (CVPR), 2026.
[Paper] [Code]

Progress-Think: Semantic Progress Reasoning for Vision-Language Navigation
Shuo Wang, Yucheng Wang, Guoxin Lian, Yongcai Wang, Maiyue Chen, kaihui.wang, Bo Zhang, Zhizhong Su, Zhou Yutian, Wanting Li, Deying Li, Zhaoxin Fan(corresponding author)
Conference on Computer Vision and Pattern Recognition (CVPR), 2026.
[Paper] [Code]

ActAvatar: Temporally-Aware Precise Action Control for Talking Avatars
Ziqiao Peng, Yi Chen, Yifeng Ma, Guozhen Zhang, Zhiyao Sun, Zixiang Zhou, Youliang Zhang, Zhengguang Zhou, Zhaoxin Fan, Hongyan Liu, Yuan Zhou, Qinglin Lu, Jun He
Conference on Computer Vision and Pattern Recognition (CVPR), 2026.
[Paper] [Code]

CUBic: Coordinated Unified Bimanual Perception and Control Framework
Xingyu Wang, Pengxiang Ding, Jingkai Xu, Donglin Wang, Zhaoxin Fan(corresponding author)
Conference on Computer Vision and Pattern Recognition (CVPR), 2026.
[Paper] [Code]

Lyapunov Probes for Hallucination Detection in Large Foundation Models
Bozhi Luan, Gen Li, Yalan Qin, Jifeng Guo, Yun Zhou, Faguo Wu, Hongwei Zheng, Zhaoxin Fan(corresponding author), Wenjun Wu
Conference on Computer Vision and Pattern Recognition (CVPR), 2026.
[Paper] [Code]

Erased, But Not Forgotten: Erased Rectified Flow Transformers Still Remain Unsafe Under Concept Attack
Nanxiang Jiang, Zhaoxin Fan(corresponding author), Enhan Kang, Daiheng Gao, Yun Zhou, Yanxia Chang, Zheng Zhu, Yeying Jin, Wenjun Wu
Conference on Computer Vision and Pattern Recognition (CVPR (Findings)) , 2026.
[Paper] [Code]

The Achilles' Heel of LLMs: How Altering a Handful of Neurons Can Cripple Language Abilities
Zixuan Qin, Kunlin Lyu, Qingchen Yu, Zhaoxin Fan(corresponding author), Yifan Sun
International Conference on Learning Representations (ICLR), 2026.
[Paper] [Code]

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks
Shiying Duan, Pei Ren, Nanxiang Jiang, Zhengping Che, Jian Tang, Zhaoxin Fan(corresponding author), Yifan Sun, Wenjun Wu
International Conference on Learning Representations (ICLR), 2026.
[Paper] [Code]

Pose-RFT: Enhancing MLLMs for 3D Pose Generation via Hybrid Action Reinforcement Fine-Tuning
Bao Li, Xiaomei Zhang, Miao Xu, Zhaoxin Fan, Xiangyu Zhu, Zhen Lei
International Conference on Learning Representations (ICLR), 2026.
[Paper] [Code]

DSSmoothing: Toward Certified Dataset Ownership Verification for Pre-trained Language Models via Dual-Space Smoothing
Ting Qiao, Xing Liu, Wenke Huang, Jianbin Li, Zhaoxin Fan, Yiming Li
The Web Conference (WWW), 2026.
[Paper] [Code]

2025

Entropy-optimized contrastive decoding for hallucination suppression in vision-language-action models
Ye Qiu, Zhaoxin Fan (corresponding author), Qingchen Yu, Faguo Wu, Hongwei Zheng, Yifan Sun, Wenjun Wu
Neurocomputing, 2025.
[Paper] [Code]

GRPCI: Harnessing Temporal-Spatial Dynamics for Graph Representation Learning
Xiang Wu, Rong-Hua Li, Zhaoxin Fan, Kai Chen, Yujin Gao, Hongchao Qin, and Guoren Wang
IEEE Transactions on Knowledge and Data Engineering (TKDE), 2025.
[Paper] [Code]

R-FGDepth: Towards Foundation Models for Recurrent Depth Learning with Frequency-Guided Initialization and Refinement
Zhaoxin Fan, Gen Li, Zhongkai Zhou
Pattern Recognition (PR), 2025.
[Paper] [Code]

A Singular Learning Theory for Unified Large Language Model Pruning
Xinyu Wang, Zhaoxin Fan (corresponding author), Faguo Wu, Hongwei Zheng, Yuanze Hu, Gen Li, Zhichao Yang, Ye Qiu, Yifan Sun, Wenjun Wu
Neurocomputing, 2025.
[Paper] [Code]

Mem4D: Decoupling Static and Dynamic Memory for Dynamic Scene Reconstruction
Xudong Cai, Shuo Wang, Peng Wang, Yongcai Wang, Zhaoxin Fan (corresponding author), Wanting Li, Tianbao Zhang, Jianrong Tao, Yeying Jin, Deying Li
AAAI Conference on Artificial Intelligence (AAAI), 2026.
[Paper] [Code]

MonoDream: Monocular Vision-Language Navigation with Panoramic Dreaming
Shuo Wang, Yongcai Wang, Wanting Li, Yucheng Wang, Maiyue Chen, Kaihui Wang, Zhizhong Su, Xudong Cai, Yeying Jin, Deying Li, Zhaoxin Fan (corresponding author)
AAAI Conference on Artificial Intelligence (AAAI), 2026.
[Paper] [Code]

SyncTalk++: High-Fidelity and Efficient Synchronized Talking Heads Synthesis Using Gaussian Splatting
Ziqiao Peng, Wentao Hu, Junyuan Ma, Xiangyu Zhu, Xiaomei Zhang, Hao Zhao, Hui Tian, Jun He, Hongyan Liu, Zhaoxin Fan (corresponding author)
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025.
[Paper] [Code]

Aux-Think: Exploring Reasoning Strategies for Data-Efficient Vision-Language Navigation
Shuo Wang, Yongcai Wang, Wanting Li, Xudong Cai, Yucheng Wang, Maiyue Chen, Kaihui Wang, Zhizhong Su, Deying Li,Zhaoxin Fan (corresponding author)
Neural Information Processing Systems Conference (NeurIPS), 2025.
[Paper] [Code]

A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing
Ming Meng, Yufei Zhao, Bo Zhang, Yonggui Zhu, Weimin Shi, Maxwell Wen, Zhaoxin Fan (corresponding author)
ACM Computing Surveys (CSUR), 2025.
[Paper] [Code]

Jailbreak Attack with Multimodal Virtual Scenario Hypnosis for Vision-Language Models
Xiayang Shi, Shangfeng Chen, Gang zhang, Zhaoxin Fan (corresponding author), Yinlin Li, Wei Wei, Jingjing Liu
Pattern Recognition (PR), 2025.
[Paper] [Code]

AsynFusion: Towards Asynchronous Latent Consistency Models for Decoupled Whole-Body Audio-Driven Avatars
Tianbao Zhang, Jian Zhao, Yuer Li, Zheng Zhu, Ping Hu, Zhaoxin Fan (corresponding author), Wenjun Wu, Xuelong Li
Chinese Conference on Pattern Recognition and Computer Vision (PRCV Best Student Paper& CCF outstanding Paper), 2025.
[Paper] [Code]

Long-VLA: Unleashing Long-Horizon Capability of Vision Language Action Model for Robot Manipulation
Yiguo Fan, Shuanghao Bai, Xinyang Tong, Pengxiang Ding, Yuyang Zhu, Hongchao Lu, Fengqi Dai, Wei Zhao, Yang Liu, Siteng Huang, Zhaoxin Fan , Badong Chen, Donglin Wang
Conference on Robot Learning (CoRL), 2025.
[Paper] [Code]

CoheDancers: Enhancing Interactive Group Dance Generation through Music-Driven Coherence Decomposition
kaixing yang, XulongTang, Haoyu Wu, Biao Qin, Hongyan Liu, Jun He, Zhaoxin Fan (corresponding author)
ACM International Conference on Multimedia (ACM MM), 2025.
[Paper] [Code]

Flexible Multi-view Clustering with Dynamic Views Generation
Yalan Qin, Nan Pu, Hanzhou Wu, Zhaoxin Fan (corresponding author)
ACM International Conference on Multimedia (ACM MM), 2025.
[Paper] [Code]

Moderating the Generalization of Score-based Generative Model
Wan Jiang, He Wang, Xin Zhang, Dan Guo, Zhaoxin Fan, Yunfeng Diao, Richang Hong
International Conference on Computer Vision (ICCV), 2025.
[Paper] [Code]

CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction
Zhefei Gong, Pengxiang Ding, Shangke Lyu, Siteng Huang, Mingyang Sun, Wei Zhao, Zhaoxin Fan, Donglin Wang
International Conference on Computer Vision (ICCV), 2025.
[Paper] [Code]

Unveiling Hidden Vulnerabilities in Digital Human Generation via Adversarial Attacks
Zhiying Li, Yeying Jin, Fan Shen, Zhi Liu, Weibin Chen, Pengju Zhang, Xiaomei Zhang, Boyu Chen, Michael Shen, Kejian Wu, Zhaoxin Fan (corresponding author), Jin Dong
Pattern Recognition (PR), 2025.
[Paper] [Code]

Phys-EdiGAN: A privacy-preserving method for editing physiological signals in facial videos
Xiaoguang Tu, Zhiyi Niu, Juhang Yin, Yanyan Zhang, Ming Yang, Lin Wei, Yu Wang, Zhaoxin Fan, Jian Zhao
Pattern Recognition (PR), 2025.
[Paper] [Code]

SafeRAG: Benchmarking Security in Retrieval-Augmented Generation of Large Language Model
Xun Liang, Simin Niu, Zhiyu Li, Sensen Zhang, Hanyu Wang, Feiyu Xiong, Zhaoxin Fan, Bo Tang, Jihao Zhao, Jiawei Yang, Shichao Song, Mengwei Wang
The 63rd Annual Meeting of the Association for Computational Linguistics (ACL), 2025.
[Paper] [Code]

MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System
Jihao Zhao, Zhiyuan Ji, Zhaoxin Fan, Hanyu Wang, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
The 63rd Annual Meeting of the Association for Computational Linguistics (ACL), 2025.
[Paper] [Code]

EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers
Daiheng Gao, Shilin Lu, Wenbo Zhou, Jiaming Chu, Jie Zhang, Mengxi Jia, Bang Zhang, Zhaoxin Fan (corresponding author), Weiming Zhang
Forty-second International Conference on Machine Learning (ICML), 2025.
[Paper] [Code]

GLDiTalker: Speech-Driven 3D Facial Animation with Graph Latent Diffusion Transformer
Yihong Lin, Zhaoxin Fan (Equal Contribution), Xianjia Wu, Lingyu Xiong, Liang Peng, Xiandong Li, Wenxiong Kang, Songju Lei, Huang Xu
34th International Joint Conference on Artificial Intelligence (IJCAI), 2025.
[Paper] [Code]

Meta-Learning Empowered Meta-Face: Personalized Speaking Style Adaptation for Audio-Driven 3D Talking Face Animation
Xukun Zhou, Fengxin Li, Ziqiao Peng, Xinyu Wang, Hongyan Liu, Zhaoxin Fan (corresponding author), Jun He
IEEE International Conference on Multimedia and Expo (ICME), 2025.
[Paper] [Code]

DualTalk: Dual-Speaker Interaction for 3D Talking Head Conversations
Ziqiao Peng, Yanbo Fan, Haoyu Wu, Xuan Wang, Hongyan Liu, Jun He, Zhaoxin Fan (corresponding author)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2025.
[Paper] [Code]

MambaVO: Deep Visual Odometry Based on Sequential Matching Refinement Training Smoothing
Shuo Wang, Wanting Li, Yongcai Wang, Zhaoxin Fan (corresponding author), Zhe Huang, Xudong Cai, Jian Zhao, Deying Li
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2025.
[Paper] [Code]

JTD-UAV: MLLM-Enhanced Joint Tracking and Description Framework for Anti-UAV Systems
Yifan Wang, Jian Zhao, Zhaoxin Fan (corresponding author), Xin Zhang, Xuecheng Wu, Yudian Zhang, Lei Jin, Xinyue Li, Gang Wang, Mengxi Jia, Ping Hu, Zheng Zhu, Xuelong Li
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2025.
[Paper] [Code]

VarGes: Improving Variation in Co-Speech 3D Gesture Generation via StyleCLIPS
Ming Meng, Ke Mu, Yonggui Zhu, Zhe Zhu, Haoyu Sun, Heyang Yan, Zhaoxin Fan (corresponding author)
Computational Visual Media (CVMJ), 2025.
[Paper] [Code]

Idea-2-3D: Collaborative LMM Agents Enable 3D Model Generation from Interleaved Multimodal Inputs
Junhao Chen, Xiang Li, Xiaojun Ye, Zhaoxin Fan (corresponding author), Hao Zhao
The 31st International Conference on Computational Linguistics (COLING), 2025.
[Paper] [Code]

2024

MLPHand: Real Time Multi-View 3D Hand Mesh Reconstruction via MLP Modeling
Jian Yang, Jiakun Li, Guoming Li, Zhen Shen, Huai-Yu Wu, Zhaoxin Fan (corresponding author)
European Conference on Computer Vision (ECCV), 2024.
[Paper] [Code]

Human Pose Driven Object Effects Recommendation
Zhaoxin Fan, Fengxin Li, Hongyan Liu, Jun He, and Xiaoyong Du
ACM International Conference on Multimedia Retrieval (ICMR), 2024.
[Paper] [Code]

ACR-Pose: Adversarial Canonical Representation Reconstruction Network for Category Level 6D Object Pose Estimation
Zhaoxin Fan, Zhenbo Song, Jian Xu, Zhicheng Wang, Kejian Wu, Hongyan Liu, and Jun He
ACM International Conference on Multimedia Retrieval (ICMR), 2024.
[Paper]

STDG: Semi-Teacher-Student Training Paradigram for Depth-guided One-stage Scene Graph Generation
Xukun Zhou, Zhenbo Song, Jun He, Hongyan Liu, Zhaoxin Fan (corresponding author)
ACM International Conference on Multimedia Retrieval (ICMR), 2024.
[Paper] [Code]

CoDancers: Music-Driven Coherent Group Dance Generation with Choreographic Unit
Kaixing Yang, Xukun Zhou, Xulong Tang, Ran Diao, Hongyan Liu, Jun He, Zhaoxin Fan (corresponding author)
ACM International Conference on Multimedia Retrieval (ICMR), 2024.
[Paper] [Code]

BeatDance: A Beat-Based Model-Agnostic Contrastive Learning Framework for Music-Dance Retrieval
Kaixing Yang, Xukun Zhou, Xulong Tang, Ran Diao, Hongyan Liu, Jun He, Zhaoxin Fan (corresponding author)
ACM International Conference on Multimedia Retrieval (ICMR), 2024.
[Paper] [Code]

SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis
Ziqiao Peng, Wentao Hu, Yue Shi, Xiangyu Zhu, Xiaomei Zhang, Hao Zhao, Jun He, Hongyan Liu, Zhaoxin Fan (corresponding author)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024.
[Paper] [Code]

MonoSIM: Simulating Learning Behaviors of Heterogeneous Point Cloud Object Detectors for Monocular 3D Object Detection
Han Sun, Zhaoxin Fan (equal contribution), Zhenbo Song, Zhicheng Wang, Kejian Wu, and Jianfeng Lu
IEEE Transactions on Instrumentation & Measurement (TIM), 2024.
[Paper] [Code]

Everything2Motion: Synchronizing Diverse Inputs via a Unified Framework for Human Motion Synthesis
Zhaoxin Fan, Longbin Li, Pengxin Xu, Fan Shen, Kai Chen
Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI), 2024.
[Paper]

FuRPE: Learning Full-body Reconstruction from Part Experts
Zhaoxin Fan, Yuqing Pan, Hao Xu, Zhenbo Song, Zhicheng Wang, Kejian Wu, Hongyan Liu, and Jun He
Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI) Workshop, 2024.
[Paper] [Code]

Multi-dimensional Fusion and Consistency for Semi-supervised Medical Image Segmentation
Yixing Lu, Zhaoxin Fan (equal contribution), Min Xu
International Conference on Multimedia Modeling (MMM), 2024.
[Paper]

A Novel Transformer Autoencoder for Multi-modal Emotion Recognition with Incomplete Data
Cheng Cheng, Wenzhe Liu, Zhaoxin Fan, Lin Feng, Ziyu Jia
Neural Networks, 2024.
[Paper]

2023

EmoTalk: Speech-Driven Emotional Disentanglement for 3D Face Animation
Ziqiao Peng, Haoyu Wu, Zhenbo Song, Hao Xu, Xiangyu Zhu, Hongyan Liu, Jun He, Zhaoxin Fan (corresponding author)
International Conference on Computer Vision (ICCV), 2023.
[Paper] [Code]

D-IF: Uncertainty-aware Human Digitization via Implicit Distribution Field
Xueting Yang, Yihao Luo, Yuliang Xiu, Wei Wang, Hao Xu, Zhaoxin Fan (corresponding author)
International Conference on Computer Vision (ICCV), 2023.
[Paper] [Code]

SelfTalk: A Self-Supervised Commutative Training Diagram to Comprehend 3D Talking Faces
Ziqiao Peng, Yihao Luo, Yue Shi, Hao Xu, Xiangyu Zhu, Hongyan Liu, Jun He, Zhaoxin Fan (corresponding author)
ACM International Conference on Multimedia (ACM MM), 2023.
[Paper] [Code]

Deep Semantic-aware Remote Sensing Image Deblurring
Zhenbo Song, Zhenyuan Zhang, Feiyi Fang, Zhaoxin Fan, Jianfeng Lu
Signal Processing, 2023.
[Paper]

Reconstruction-Aware Prior Distillation for Semi-supervised Point Cloud Completion
Zhaoxin Fan, Yulin He, Zhicheng Wang, Kejian Wu, Hongyan Liu, Jun He
International Joint Conference on Artificial Intelligence (IJCAI), 2023.
[Paper]

Robust Single Image Reflection Removal Against Adversarial Attacks
Zhenbo Song, Zhenyuan Zhang, Kaihao Zhang, Wenhan Luo, Zhaoxin Fan, Wenqi Ren, Jianfeng Lu
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023.
[Paper]

GIDP: Learning a Good Initialization and Inducing Descriptor Post-enhancing for Large-scale Place Recognition
Zhaoxin Fan, Zhenbo Song, Hongyan Liu, Jun He
International Conference on Robotics and Automation (ICRA), 2023.
[Paper]

2022

Object Level Depth Reconstruction for Category Level 6D Object Pose Estimation From Monocular RGB Image
Zhaoxin Fan, Zhenbo Song, Jian Xu, Zhicheng Wang, Kejian Wu, Hongyan Liu, Jun He
European Conference on Computer Vision (ECCV), 2022.
[Paper] [Code]

RPR-Net: A Point Cloud-based Rotation-Aware Large Scale Place Recognition Network
Zhaoxin Fan, Zhenbo Song, Wenping Zhang, Hongyan Liu, Jun He, Xiaoyong Du
European Conference on Computer Vision Workshop (ECCV Workshop), 2022.
[Paper]

SVT-Net: Super Light-Weight Sparse Voxel Transformer for Large Scale Place Recognition
Zhaoxin Fan, Zhenbo Song, Zhiwu Lu, Hongyan Liu, Jun He, Xiaoyong Du
AAAI Conference on Artificial Intelligence (AAAI), 2022.
[Paper] [Code]

Unsupervised Multi-task Learning for 3D Subtomogram Image Alignment, Clustering and Segmentation
Haoyi Zhu, Chuting Wang, Yuanxin Wang, Zhaoxin Fan, Mostofa Rafid Uddin, Xin Gao, Jing Zhang, Xiangrui Zeng, Min Xu
IEEE International Conference on Information Processing (ICIP), 2022.
[Paper]

PilotAttnNet: Multi-Modal Attention Network for End-to-End Steering Control
Jincan Zhang, Zhenbo Song, Jianfeng Lu, Xingwei Qu, Zhaoxin Fan
Chinese Conference on Pattern Recognition and Computer Vision (PRCV), 2022.
[Paper]

Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive Overview
Zhaoxin Fan, Yazhi Zhu, Yulin He, Qi Sun, Hongyan Liu, Jun He
ACM Computing Surveys (CSUR), 2022.
[Paper]

2020-2021

SRNet: A 3D Scene Recognition Network using Static Graph and Dense Semantic Fusion
Zhaoxin Fan, Hongyan Liu, Jun He, Qi Sun, Xiaoyong Du
Computer Graphics Forum (CGF), 2020.
[Paper]

A Graph‐based One‐Shot Learning Method for Point Cloud Recognition
Zhaoxin Fan, Hongyan Liu, Jun He, Qi Sun, Xiaoyong Du
Computer Graphics Forum (CGF), 2020.
[Paper]

MPDNet: A 3D Missing Part Detection Network Based on Point Cloud Segmentation
Zhaoxin Fan, Hongyan Liu, Jun He, Min Zhang, Xiaoyong Du
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021.
[Paper]

DAGC: Employing Dual Attention and Graph Convolution for Point Cloud based Place Recognition
Qi Sun, Hongyan Liu, Jun He, Zhaoxin Fan, Xiaoyong Du
ACM International Conference on Multimedia Retrieval (ICMR), 2020.
[Paper]

PointFPN: A Frustum-based Feature Pyramid Network for 3D Object Detection
Zhaoxin Fan, Hongyan Liu, Jun He, Siwei Jiang, Xiaoyong Du
International Conference on Tools with Artificial Intelligence (ICTAI), 2020.
[Paper]

Patents

Chinese National Invention Patent: 一种限高装置高度检测方法和系统. 国家发明专利. CN113658226A
Chinese National Invention Patent: 一种多视角图像的生成方法及装置. 国家发明专利. CN119625150A
Chinese National Invention Patent: 一种基于深度估计的单目物体三维重建方法及装置. CN119784930A
Chinese National Invention Patent: 基于视觉风格特征的多样性增强协同语音动作生成系统. 国家发明专利. CN119540034A
Chinese National Invention Patent: 基于动态神经网络和特征调制的零样本语音克隆方法. 国家发明专利. CN119360821A
Chinese National Invention Patent: 一种使用单目RGB图像进行虚拟人驱动的方法. 国家发明专利. CN116597509A
Chinese National Invention Patent: 一种基于 Wav2Lip 模型视频说话人的后处理方法. 国家发明专利. 2024113137542
Chinese National Invention Patent: 一种纹理重建方法及装置. 国家发明专利. 2024116956146
Chinese National Invention Patent:一种提高数字人姿态估计的对抗性攻击方法及装置. 国家发明专利. 202510427766.6
Chinese National Invention Patent: 基于双向对偶耦合的数字人表情编辑方法. 国家发明专利. 202510654473.1
Chinese National Invention Patent: 基于流形投影的数字人手-物协同视频生成方法. 国家发明专利. 202510654479.9

Jason Zhaoxin Fan