分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2024-01-07
摘要: 多层感知机(MLP)是一种前馈神经网络,通过在网络中加入一个或者更多个隐藏层,克服了线性模型的限制,打开了深度学习的大门。本文利用了多层感知机完成图像分类,在Fashion MNIST数据集上进行了探索,并尝试迁移到MNIST数据集中。在Fashion MNIST上我们进行特征预处理后,选择了不同的优化方法并进行比较,此外分别通过增加丢弃法和权重衰减法等正则化方法,实现了对多层感知机的优化、改进。通过实验表明,适当的特征处理能够提高模型的数值稳定性。动量法显著提高了模型效果,同时权重衰减等方法对提高模型的泛化效果起到了帮助。