这篇教程训练集准确率97%(很高),测试集准确率50%~60%(很低),解决方案探索写得很实用,希望能帮到您。
训练集准确率97%(很高),测试集准确率50%~60%(很低),解决方案探索
训练集在训练过程中,loss稳步下降,准确率上升,最后能达到97%
验证集准确率没有升高,一直维持在50%左右(二分类问题,随机概率)
测试集准确率57%
在网上搜索可能打的原因:
1.learning rate太小,陷入局部最优
2.训练集和测试集数据没有规律
3.数据噪声太大
4.数据量太小(总共1440个样本,80%为训练集)
5.训练集和测试集数据分布不同:如训练集正样本太少(训练集和测试集每次运行随机选择,故排除)
6.数据集存在问题,如标注有问题(采用公开数据集,排除)
7.学习率过大???
8.模型参数量过多而数据量过少
9.过拟合
10.输入到网络中的特征有问题,特征与label之间没有很明确的关联,或特征太少
11.数据没有归一化
自己猜测可能的问题:
1.正好选择了效果差的被试(脑电数据不同被试之间识别准确率有一定差距)
2.输入样本的特征向量维度太大,而数据量不够大
batch size选多少合适? Keras 最新《面向小数据集构建图像分类模型》 |