方法任务类型划分方式计算量优点缺点适用场景K折交叉验证通用将数据集分为 K 个子集,每次选取一个子集作为验证集中等充分利用数据,可以更准确地评估模型性能计算量较大通用分层K折交叉验证通用类似于 K 折交叉验证,但保持每个折中类别比例中等对于不平衡数据集,保证了每个折中的类别比例计算量较大数据不平衡时时间序列交叉验证时间序列数据根据时间顺序划分数据,保证训练集在测试集之前低考虑了时间序列数据的顺序性,适合于时间序列预测任务不适用于非时间序列数据时间序列预测任务留一交叉验证通用每次将一个样本作为验证集高最大程度利用数据,评估结果准确计算量巨大,效率低下数据集较小时留P交叉验证通用每次留下 P 个样本作为验证集高可以自定义留下的样本数量 P,适用于不同情况计算量较大,效率低下数据集较小时重复K折交叉验证通用对 K 折交叉验证进行多次重复高提供更稳健的评估结果,减少因随机性引起的评估误差计算量更大需要更加稳健的评估结果留出交叉验证通用将数据集划分为训练集和测试集,通常使用固定比例低计算量低,简单易用不充分利用数据数据集较大时自助采样交叉验证通用通过自助采样的方式随机采样训练集高充分利用数据,对于小样本数据集效果好计算量较大,可能会产生相似的训练样本,引入估计偏差数据集较小,或者需要处理小样本数据时蒙特卡洛交叉验证通用随机重复采样和验证高可以得到对数据的全面评估计算量非常大需要对模型进行全面评估时重复随机子采样交叉验证通用通过随机子采样的方式重复采样训练集高充分利用数据,减少因样本选择的随机性引起的评估误差计算量较大,可能会产生相似的训练样本,引入估计偏差数据集较小,或者需要处理小样本数据时版权声明:
本文来源网络,所有图片文章版权属于原作者,如有侵权,联系删除。
本文网址:https://www.mushiming.com/mjsbk/6483.html