Mingshuo Cai (蔡明硕)
I’m a third year undergraduate student from School of Artifical Intelligence, Xidian University. My research interest is 3D computer vision.
I am very fortunate to be advised by Bobo Xi of State Key Laboratory of Integrated Service Networks, School of Telecommunications Engineering, Xidian University.
📝 Publications
Mind the Gap: Multi-Level Unsupervised Domain Adaptation for Cross-scene Hyperspectral Image Classification
Mingshuo Cai, Bobo Xi. (2024). "Mind the Gap: Multi-Level Unsupervised Domain Adaptation for Cross-scene Hyperspectral Image Classification" TGRS.
🤖nanoGPT-Tutorial-CN
Mingshuo Cai. (2024). "An Open-sourced Chinese Tutorial fo nanoGPT" Github.
🏅 Competitions
👨💻 Selected Blog Posts
一些数字图像处理知识
Published:
记录一些数字图像处理的知识
Pytorch进阶之那些基础但重要的知识点二
Published:
因为我在深度学习的上机中对于“冻结权重”这个相对常见的操作感到一脸懵逼,这还是在提醒我自己的torch并不熟练。
HandNeRF—建模位置驱动的交互双手
Published:
一篇专注于交互双手的Nerf工作。
相机成像基础知识补充
Published:
这篇blog补充一些3dv中相机成像,坐标转换balabala的知识
3dv入门—3D Gaussian Splatting
Published:
听群友这样说,在3dv 2024会议上,3DGS一作讲论文的时候NeRF一作进来发现没位置了,还被关门外了
Pytorch进阶之那些基础但重要的知识点
Published:
如果只沉迷于无意义的炼丹,我们的编程水平会不可否认的越来越差的。
LLM入门3之初识llama2
Published:
似乎LLM微调的终点是去做NLP算法工程师了?这样正好,反正cv也一点卷不动
一些数字信号处理知识
Published:
由于我连最基本的离散傅里叶变换都不清楚了,因此我决定抽时间把里面用到的信号知识稍微记录一下
3dv入门—NeRF
Published:
在漫威的Snap卡牌游戏中,升级卡牌的方式是这样的,2D->打破边框->3D->动画….
LLM入门2
Published:
训练tokenizer更像是一种经典机器学习的统计模型,是确定性的,在代码中也是这样,更多的功夫要用在数据的处理和优化上。
LLM入门1之阅读综述论文
Published:
这篇博客介绍了我在阅读论文Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond时的笔记
Diffusion入门知识3—初识扩散模型
Published:
在推导完VAE之后,我们有信心对着Diffusion出发了
Diffusion入门知识2—熟悉VAE
Published:
如果你跟VAE很熟,那你一定熟悉变分下界的推导吧
Diffusion入门知识1—初识VAE
Published:
这篇博客介绍了我在入门diffusion时入门所学到的一些生成模型的的笔记
无人机复现
Published:
这里记录了我复现浙江大学的项目Fast:Drone250,我独立完成了焊接,环境配置,程序烧录等步骤,下面是当时的一些记录。
Intel OpenBot复现
Published:
这里记录了我复现Intel公司的项目OpenBot的经历