机器学习 – 将用户反馈纳入ML模型

我为分类(0/1)NLP任务开发了ML模型,并将其部署在生产环境中.向用户显示模型的预测,并且用户可以选择提供反馈(如果预测是正确/错误的话).

如何在模型中不断加入这些反馈?从用户体验的角度来看,你不希望用户为特定输入校正/教导系统超过两次/三次,系统会快速学习,即反馈应该“快速”合并. (Google优先收件箱以无缝方式执行此操作)

如何建立我的系统可以改进的“反馈循环”?我在网上搜索了很多但找不到相关资料.任何指针都会有很大的帮助.

请不要说通过包含新的数据点从头开始重新训练模型.肯定不是谷歌和Facebook如何建立他们的智能系统

为了进一步解释我的问题 – 想想谷歌的垃圾邮件检测器或他们的优先收件箱或他们最近的“智能回复”功能.众所周知,他们有能力学习/合并(快速)用户提要.

一直以来它快速整合了用户反馈(即用户必须教导系统每个数据点最多输出2-3次,并且系统开始为该数据点提供正确的输出)并且它还确保它保持旧的学习和在结合新数据点的学习的同时,不会开始在较旧的数据点上提供错误的输出(它提前提供正确的输出).

我还没有找到任何关于如何构建这样的系统的博客/文献/讨论 – 一个在ML系统中以详细说明循环解释的智能系统

希望我的问题现在更清楚了.

更新:我发现的一些相关问题是:

> Does the SVM in sklearn support incremental (online) learning?
> https://datascience.stackexchange.com/questions/1073/libraries-for-online-machine-learning
> http://mlwave.com/predicting-click-through-rates-with-online-machine-learning/
> https://en.wikipedia.org/wiki/Concept_drift

更新:我仍然没有具体的答案,但这样的配方确实存在.阅读以下博客Machine Learning != Learning Machine中的“从反馈中学习”部分.在这里,Jean谈到“向机器添加反馈提取循环”.同样在here,here,here4.

构建一个简单,轻便的模型,可以根据反馈进行更新.在线机器学习为此提供了许多候选人

最好的在线分类器是线性的.在这种情况下,我们可以通过一个小的浅层神经网络将它们组合在一起并实现非线性

https://stats.stackexchange.com/questions/126546/nonlinear-dynamic-online-classification-looking-for-an-algorithm

相关文章
相关标签/搜索