北京大学智能科学与技术专业大三学生。专注计算机视觉、多模态学习与 3D 重建,热爱用代码探索 AI 的边界。
基于 Deep Image Prior (CVPR 2017) 的改进研究,探索无监督图像重建的可能性。
改进 DeGauss (ICCV 2025),实现 3D 高斯泼溅的多模态语言-视觉融合。
改进 OnlineLangSplat,实现在线语言引导的 3D 场景理解与机器人交互。
改进 Tree-Ring Watermark (NeurIPS 2023),研究扩散模型的数字水印技术。