| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
原始链接: https://news.ycombinator.com/item?id=39672450
Fredholm 方程涉及求解线性系统(通常包括卷积运算),而卷积涉及将滤波器内核(通常使用点积表示)直接应用于输入信号。 不过,在一定条件下,通过求解 Fredholm 方程得到的解可以看作是卷积滤波器。 然而,通常认为将卷积直接应用于信号计算速度更快。 因此,虽然 Fredholm 解决方案可能涉及内核的卷积,但它并不完全等同于执行标准卷积运算。 此外,强化学习涉及基于代理与环境之间的交互来优化策略网络,而不是涉及卷积运算来直接处理视觉输入。 尽管如此,策略可以包括通过卷积自动编码器或特征提取器等技术学习的特征,使策略的输出成为一种混合输出空间,包括像素值(用于动作控制)和更高级别的特征(例如场景类别或对象位置, 用于决策)。 这些输出空间使强化学习器能够根据输入的局部(像素级)和全局(场景级)属性执行操作,从而在决策过程中提供更大的灵活性。
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
Happy to answer any questions.
reply