机器学习数据缺失_机器学习之信息缺失

正常的机器学习，分类器通过输入输出数据的训练，来学习到规则，然后得到输入便可以给出输出，下面来个简单的例子输入位两个小数，输出为第一个数字大于第二个数字准备训练和评估数据初始化分类器训练分类器评估网络网络经过1000个数据的训练，可以说正确率已经达到了100%，任务就完成了。但是实际情况却很有很多数据的缺失，例如股票数据训练的时候可以有价格交易量，但是新闻却没办法量化，打牌的时候你知道底牌和自己的

weixin_39625864

475人浏览 · 2021-01-28 00:40:52

weixin_39625864 · 2021-01-28 00:40:52 发布

正常的机器学习，分类器通过输入输出数据的训练，来学习到规则，然后得到输入便可以给出输出，下面来个简单的例子

输入位两个小数，输出为第一个数字大于第二个数字

准备训练和评估数据

初始化分类器

训练分类器

评估网络

网络经过1000个数据的训练，可以说正确率已经达到了100%，任务就完成了。但是实际情况却很有很多数据的缺失，例如股票数据训练的时候可以有价格交易量，但是新闻却没办法量化，打牌的时候你知道底牌和自己的牌，但是缺失别人的牌的信息，诸如此类的情况，当然，这种情况就不可能追求100%的准确率了，那此时准确率极限是多少呢，机器学习能不能达到这个极限呢，下面就上面的例子做延申，把训练和评估数据中的第二个数字隐藏，看看最终表现如何