文章
77
标签
35
分类
12
首页
时间轴
标签
分类
雯欂の修仙笔记
Differentiable MPC for End-to-end Planning and Control
返回首页
搜索
首页
时间轴
标签
分类
Differentiable MPC for End-to-end Planning and Control
发表于
2026-06-16
|
更新于
2026-06-25
|
论文解读
3. 可微LQR
文章作者:
沉迷修仙の雯欂
文章链接:
https://wblv66.top/2026/06/16/论文解读/Differentiable MPC for End-to-end Planning and Control/
版权声明:
本博客所有文章除特别声明外,均采用
CC BY-NC-SA 4.0
许可协议。转载请注明来源
雯欂の修仙笔记
!
上一篇
OptNet: Differentiable Optimizationasa Layerin Neural Networks
此论文通过隐式方法将优化问题表达为神经网络中的一层,它的内部不是传统意义上的神经元堆叠,不是包含全连接层、激活函数等结构,而是一个特殊的“可学习的可微优化层” 通过理论推导得到它的前向传播和反向传播的公式表达,并不需要定义它的内部结构 2. 相关研究 使用神经网络解决受限类别的优化问题的整体思路一般可以分为四种 基于能量的学习方法(Energy-based learning methods) 总体思路为:在训练过程中将能量函数在观测数据流形附近调低,而在其他地方调高。缺点:一些问题中可能没有参测数据;可能会出现不稳定问题 解析法(Analytically) 如果能找到优化问题的解析解,那么梯度一般也可以解析地计算出来。缺点:大多数问题没有解析解 展开(Unrolling) 将优化问题的迭代求解过程近似展开为神经网络的结构。缺点:展开操作会增加网络的复杂性和深度;对于有约束的问题可能难以展开 最小化操作求导(Argmin differentiation) 类似本文的操作,对argmin问题进行微分 3. OptNet:在神经网络中解决优化问题 本文重点研究二次规划问题 minz ...
下一篇
Learning Agile Gate Traversal via Analytical Optimal Policy Gradient
Arxiv 1. 介绍 四旋翼是欠驱动的,平移和旋转动力学是耦合的,因此,在受限空间内进行运动规划和控制很有挑战性。穿过窄门是一个典型且要求很高的任务,需要非常灵活的飞行、精确的姿态控制,以及严格遵守时空约束。这个任务被广泛用作评估敏捷运动规划和控制方法的标准 2. 问题提出 跟踪参考轨迹的MPC被定义为 π(x)=arg minξ J(ξ)=∑k=0N−1c(xk,uk)+cN(xN)s.t. xk+1=f(xk,uk),f(xk,uk)≤0,gN(xN)≤0,x0=xinit\begin{align*} \pi(x)= \argmin _{ \xi} \ &J(\xi)= \sum_{k=0}^{N-1} c(\bm{x}_k,\bm{u}_k)+c_N(\bm{x}_N) \\ \text{s.t.} \ & \bm{x}_{k+1}=f(\bm{x}_k,\bm{u}_k), \\ & f(\bm{x}_k,\bm{u}_k) \leq 0, \\ & g_N(\bm{x}_N) \leq 0, \\ & \bm{x}_0=\...
沉迷修仙の雯欂
文章
77
标签
35
分类
12
公告
This is my Blog
目录
3. 可微LQR
搜索
数据加载中