cloudinwind's blog

Research Technical Daily Life Game

Academic Projects Talks Douban Links About Travellings 🚇

Back

Archives

`2026`

34 posts

Jun 7, 2026

Paper Reading: CV 3
Jun 7, 2026

Paper Reading: CV 2
Jun 6, 2026

Paper Reading: CV 1
Jun 1, 2026

Ubuntu OpenSSH 远程服务器配置教程
May 24, 2026

Paper Reading: Embodied AI 5
May 24, 2026

Paper Reading: Embodied AI 4
Apr 22, 2026

在本地电脑上配置 GitHub 权限（SSH/HTTPS）
Apr 22, 2026

Linux 无图形界面服务器代理配置（Clash Verge 方案）
Apr 22, 2026

纯 SSH 服务器配置 RustDesk（命令行方案）
Apr 22, 2026

用 scp 向远程服务器传送文件
Apr 22, 2026

共享服务器下 Git 版本管理实战（Linux/macOS/Windows）
Apr 22, 2026

Vim 详细使用教程：从入门到高频操作
Apr 18, 2026

Vibe Coding For AI 2: Claude CLI 安装与使用指南
Apr 18, 2026

Vibe Coding For AI 3: Codex CLI 安装与使用指南
Apr 18, 2026

Vibe Coding For AI 4: Gemini CLI 安装与使用指南
Apr 17, 2026

SSH 断连不掉任务：tmux 入门教程
Apr 16, 2026

Ubuntu 24.04 安装 MATLAB R2024a
Apr 16, 2026

如何把本地项目上传到 GitHub 仓库（完整教程）
Apr 15, 2026

A800 服务器深度学习环境标准配置教程
Apr 14, 2026

在 VSCode 上配置 SSH 远程开发
Apr 4, 2026

Vibe Coding For AI 1: Windows 上配置 Coding Agent 指南
Apr 1, 2026

Paper Reading: Embodied AI 3
Jan 7, 2026

RL笔记（29）：推理模型的崛起 (GRPO & PRM)
Jan 6, 2026

RL笔记（28）：大语言模型与强化学习 (LLM + RLHF)
Jan 6, 2026

Paper Reading: Embodied AI 2
Jan 5, 2026

RL笔记（27）：MARL 最后的波纹 (MAT & HASAC)
Jan 4, 2026

RL笔记（26）：异构智能体信任区域优化 (HAPPO & HATRPO)
Jan 4, 2026

Paper Reading: Embodied AI 1
Jan 3, 2026

RL笔记（25）：多智能体策略梯度 (MADDPG & MAPPO)
Jan 2, 2026

RL笔记（24）：超越单调性 (QTRAN, WQMIX, QPLEX)
Jan 1, 2026

RL笔记（23）：多智能体值分解 (VDN & QMIX)
Apr 14, 2026

Slay the Spire: Silent Cards 评测
Apr 13, 2026

Galgame 简评系列 1
Apr 13, 2026

Galgame 简评系列 2

`2025`

32 posts

Dec 31, 2025

RL笔记（22）：初入多智能体强化学习 (MARL)
Dec 30, 2025

RL笔记（21）：目标导向的强化学习 (Goal-Conditioned RL)
Dec 30, 2025

Paper Reading: LLM 1
Dec 30, 2025

Paper Reading: MLLM 1
Dec 30, 2025

Paper Reading: LLM 2
Dec 30, 2025

Paper Reading: MLLM 2
Dec 30, 2025

Paper Reading: Unify MLLM 1
Dec 30, 2025

Paper Reading: Unify MLLM 1
Dec 29, 2025

RL笔记（20）：Decision Transformer
Dec 28, 2025

RL笔记（19）：离线强化学习 (Offline RL)
Dec 27, 2025

RL笔记（18）：基于模型的策略优化 (MBPO)
Dec 27, 2025

Paper Reading: VLM 1
Dec 27, 2025

Paper Reading: VLM 2
Dec 26, 2025

Paper Reading: Basic Method 1
Dec 26, 2025

Paper Reading: MARL 1
Dec 26, 2025

RL笔记（17）：模型预测控制 (MPC)
Dec 25, 2025

RL笔记（16）：模仿学习 (Imitation Learning)
Dec 24, 2025

RL笔记（15）：SAC
Dec 23, 2025

RL笔记（14）：SQL
Dec 22, 2025

RL笔记（13）：DDPG
Dec 21, 2025

RL笔记（12）：PPO
Dec 20, 2025

RL笔记（11）：TRPO
Dec 19, 2025

RL笔记（10）：Actor-Critic
Dec 18, 2025

RL笔记（9）：REINFORCE
Dec 17, 2025

RL笔记（8）：DQN
Dec 16, 2025

RL笔记（7）：Dyna-Q
Dec 15, 2025

RL笔记（6）：时序差分
Dec 14, 2025

RL笔记（5）：蒙特卡洛
Dec 13, 2025

RL笔记（4）：动态规划
Dec 12, 2025

RL笔记（3）：马尔可夫决策过程
Dec 11, 2025

RL笔记（2）：多臂老虎机
Dec 10, 2025

RL笔记（1）：初入强化学习

© 2026 云之痕 & Site policy Astro theme powered