首頁 » 不知道何时停止训练模型

不知道何时停止训练模型

在数据科学周期中像仓鼠一样转圈?

模型评估是数据科学项目,正是这一部 不知道何时停止训练模型 分量化了你 不知道何时停止训练  的模型有多好,它比以前的版本改进了多少,比你的同事的模型好多少,以及还有多少改进空间。

在本系列文章中

我们回顾了不同的评分指标:针对分类、数值预测、不平衡 手机号码数据 数据集以及其他类似或多或少具有挑战性的模型评估问题。

今天:使用利润矩阵对分类结果进行奖励和惩罚
混淆矩阵和类别统计 总结分类模型的性能:实际和预测 该产品应采用什么标价? 的目标类别分布、分配到正类的准确率以及检测正类事件的能力。然而,这些统计数据没有考虑错误的成本,即预测到错误的目标类别。

如果目标类别分布不平衡,则将事件正确预测为少数类别需要较高的模型性能,而将事件预测为多数类别则很容易偶然发生。在评估模型性能时,考虑到这一点并对结果进行不同的加权不是很有用吗?

归根结底,分类的

最终目标决定了是否有必要为某些类型的分类结果 往 印度手机号码 任何 引入成本。当对一个目标类别的错误预测比对其他类别的错误预测产生更严重的后果时,成本是有用的。或者换句话说,对一个类别的正确预测比对其他类别的正确预测产生更有利的后果。例如,在机场安检处未发现犯罪乘客比错误地将无威胁乘客归类为危险乘客产生更严重的后果。因此,这两种类型的错误预测应该有不同的权重。如果所有目标类别都同样有趣或重要,并且对一个目标类别的错误预测的后果与对其他类别的后果一样严重,则不需要成本。例如,当我们预测葡萄酒的颜色或顾客的性别时就是这种情况。

返回頂端