代码之家 › 专栏 › 技术社区 › ldog

连续与离散人工神经网络

neural-network artificial-intelligence algorithm

ldog · 技术社区 · 15 年前

我意识到这可能是一个很小的问题,但是有没有人有过使用连续神经网络的经验?我特别感兴趣的是一个连续的神经网络可能对什么有用,而不是你通常使用离散的神经网络。

为了清楚起见,我将澄清我所说的连续神经网络,因为我认为它可以被解释为不同的意思。我愿意不意味着激活函数是连续的。相反,我提到了将隐藏层中的神经元数量增加到无限大的想法。

为了清楚起见,这里是典型的离散nn的架构: alt text 这个 x 是输入,是 g 是隐藏层的激活 v 是隐藏层的权重, w 是输出层的权重, b 是偏压,显然输出层有一个线性激活(即无)。

离散nn和连续nn之间的差异如下图所示: alt text 也就是说,你让隐藏的神经元数量变得无限,这样你的最终输出就是一个积分。在实践中,这意味着你必须用求积来逼近相应的积分,而不是计算确定性和。

显然这是神经网络的一个常见误解,即太多隐藏的神经元会产生过度拟合。

我的问题是,考虑到离散和连续神经网络的定义,我想知道是否有人有使用后者的经验,以及他们使用它们的目的是什么。

4 回复 | 直到 8 年前

Hayman 15 年前

在过去,我用连续神经网络做过一些研究项目。激活是用双极双曲tan来完成的,网络接受几百个浮点输入,输出大约一百个浮点值。

在这种特殊情况下,网络的目的是学习矿物列车的动力学方程。该网络给出了列车的当前状态,并预测了未来50秒的速度、车厢间动力学和其他列车行为。

这个特殊项目的基本原理主要是性能。这是针对一个嵌入式设备,评估神经网络比解决一个传统的常微分方程(ODE)系统性能友好得多。

一般来说,连续神经网络应该能够学习任何类型的函数。当使用确定性方法无法/极难解决系统时,这尤其有用。与通常用于模式识别/分类的二进制网络相反。

考虑到神经网络的不确定性本质,任何类型的神经网络都是敏感的野兽,选择正确的输入/网络架构都可能是一种黑色艺术。

Eric 15 年前

我认为这要么只是一些试图证明没有函数超出nn结构的逼近能力的理论家感兴趣,要么是关于构造函数的分段线性逼近(通过反向传播)方法的一个命题。如果是后者,我认为现有的方法比反向传播要快得多,不易受局部极小值的影响,也不容易过度拟合。

我对神经网络的理解是,连接和神经元包含它所训练的数据的压缩表示。关键是,您拥有一个大型数据集,它需要的内存比每个示例中突出显示的“一般课程”要多。神经网络被认为是一个经济的容器,可以从庞大的语料库中提炼出这一普遍的教训。

如果你的神经网络有足够多的隐藏单元来对原始函数进行密集采样,这相当于你的神经网络足够大,能够记住训练语料库(而不是从中归纳)。把训练语料库看作是给定分辨率下原始函数的样本。如果神经网络有足够的神经元以比你的训练语料库更高的分辨率采样函数,那么系统就没有压力去概括,因为它不受神经元数量的限制。

由于不需要归纳或概括,你最好把你所有的训练数据存储在内存中,并使用k近邻,这将总是性能比任何神经网络都好,而且即使在神经网络的采样分辨率接近无穷大的情况下,性能也总是和任何神经网络一样好。

dwf 15 年前

这个词在机器学习的文献中还没有很流行,这解释了所有的困惑。这似乎是一个一次性的文件,一个有趣的文件,但它并没有真正导致任何事情,这可能意味着几件事,作者可能只是失去了兴趣。

我知道Radford Neal成功地使用了贝叶斯神经网络(具有可数的多个隐藏单元,“连续神经网络”一文扩展到了不可数的情况)。 his thesis 所有关于这些事情)赢得 NIPS 2003 Feature Selection Challenge 使用贝叶斯神经网络。

dwf 15 年前

前馈神经网络总是“连续的”——这是反向传播学习实际工作的唯一方式(不能通过离散/阶跃函数反向传播,因为在偏差阈值下它是不可微的)。

您可能有输入或目标输出的离散(例如“一个热”)编码,但所有计算都是连续值的。输出可以是受限的(即,使用softmax输出层,使得输出总是总和为一,这在分类设置中是常见的),但是仍然是连续的。

如果你指的是预测一个连续的、无约束的目标的网络——想想“正确答案”不是离散的、线性回归模型不够的任何预测问题。递归神经网络在不同时期已经成为各种金融预测应用的流行方法,例如。