PyTorch 深度学习课程
10 章节实战课程,从张量到部署。涵盖 CNNs、迁移学习、Vision Transformers (ViT)、TensorBoard 实验追踪、Gradio 模型部署。
我专注于数学理论与机器学习工程的交叉领域。 研究重点在于将严谨的数学基础应用于实际工程:训练稳定性、损失地形几何分析、以及构建可复现的研究原型。
目前正在探索拓扑数据分析如何指导优化器行为, 以及世界模型如何在高频环境中学习潜在动力学。 我注重评估规范,致力于编写他人能够实际运行的研究代码。
深度学习与强化学习开源教育资源。
10 章节实战课程,从张量到部署。涵盖 CNNs、迁移学习、Vision Transformers (ViT)、TensorBoard 实验追踪、Gradio 模型部署。
4 阶段课程,从 RL 基础到机器人级世界模型。涵盖 DQN、PPO、基于模型的规划(MPC、CEM)、Isaac Lab 集成与 Sim-to-Real。
强化学习、优化、大语言模型系统相关工作精选。
面向 60Hz 物理驱动游戏环境的 DreamerV3 风格智能体,具有严格的失败约束。 基于自定义 Gymnasium 栈、Windows↔WSL 同步、高频日志记录实现可复现评估。
基于 GUDHI 的 PyTorch 优化器,利用 TDA 特征探测局部损失地形几何(尖锐 vs 平坦区域), 并通过稳定性保障机制自适应调整更新行为。
面向 Dream-7B 和 GPT-OSS-20B 的内存高效微调流水线, 采用 QLoRA、梯度检查点和 DeepSpeed 优化。