在MATLAB中将数据拆分为训练/测试数据集?

经过一些研究,我在MATLAB中找到了两个函数来完成任务:

>统计工具箱中的> cvpartition功能
> crossvalind Bioinformatics Toolbox中的功能

现在我使用cvpartition来创建n倍交叉验证子集,以及Statistics工具箱中的Dataset / Nominal类.所以我只是想知道两者之间的区别和各自的优缺点是什么?

扩展到 @Mr Fooz’s answer

They look to be pretty similar based on the official docs of cvpartition and crossvalind, but crossvalind looks slightly more flexible (it allows for leave M out for arbitrary M, whereas cvpartition only allows for leave 1 out).

……你总是可以使用具有适当k值的kfold交叉验证来模拟离开M-out(将数据分成k折叠,在一个上测试,在所有其他上训练,并为所有折叠执行此操作)并且取平均值因为留一出是kfold的一个特例,其中k =观测数量?

相关文章
相关标签/搜索