强制休眠的英文眠翻译眠英语怎么说-关于道德的作文素材


2023年4月1日发(作者:少儿英语歌曲视频)

数据挖掘之OneR算法(原来数据挖掘如此简单!)

⼈⼈都能看懂的数据挖掘之OneR算法(原来数据挖掘如此简单!)

如标题所⾔,我要以最通俗易懂的⽅法向⼤家介绍⼀个简单的数据挖掘算法——OneR算法,为了每个⼈都能看懂,这⾥将

不涉及专业术语,不要求任何关于数据挖掘的背景知识,只需要跟着我的思路⼀步⼀步⾛就⾏!

在OneR算法要⼲什么?

要想最快地明⽩⼀件事情,⾸先要搞清楚其⽬的。OneR是OneRule的意思,即⼀个规则,只看某事物的⼀个特征,然后来预测该事物的类

别。不明⽩,没事,举个害羞的近义词是什么 例⼦你就明⽩了。

⽐如,现在给出⼀条数据,该数据描述了⼀个⼈的三正是江南好风景的下一句 个特征:⾝⾼,体重,头发长短,根据这三个特征来预测该⼈的性别类,男或⼥。如果

以我们⼈类的思维来看这个问题,⼀般来说,如果这个⼈的⾝⾼为⾼挑(假如超过1.7⽶为⾼,否则为矮),体重为重(假如超过120⽄为

重,否则为矮),头发为短(假如头发过肩为长,否则为短),那么我们可以预测这个⼈属于类别男。这⾥,我们把数据中三个特征都看

了,然后才预测出该⼈的性别,⽽OneR算法则希望找出⼀个准确率最⾼的特征,⽐如头发,然后只根据头发的长短来预测该⼈所属性别。

如,如果该⼈的头发为短,则直接判断该⼈的性别为男性。这就是OneR算法。是不是很简单?

如果找出最好的特征?

我们上⾯说了,要从多个特征中找出准确率最⾼或者说是错误率最低⼀个特征来预测该事物的类别。那赠花卿拼音 么如何找出那个最好的特征呢?这就

需要对现有的数据来进⾏统计分析了。池塘生春草下一句 其实这个过程是⾮常简单的。

⽐如我们现在有10条数据。

我们分别对每个特征进⾏统计,统计结果如下:

先来看⾝⾼的统计结果,男中有4个为⾼,只有1个为矮,那么我们可以认为⾝⾼为⾼的⼈⼀般性别为男,相对较矮的则判断为⼥性,如果

以这样的规则来预测的话,那么会出现⼏个错误呢?图中红⾊的就是错误的,可以看到,男的为1个八月十五夜月古诗带拼音 ,⼥的为两个,总共为3,那么,如果

⽤⾝⾼这个特征来判断性别的话,错误数为3,即错误率为30%。

同理,由体重的统计结果可以得出,错误数为4,⽽头发映衬的近义词 长短这个特征的话错误数为2。

由此,三个特征的错误数分别为3,4,2,明显错误最少的特征为头发长短,也就是说,根据头发长短来判断性别的准确度是最⾼的,所以

我们选择头发长短这个特征来作为预测性别的唯⼀规则(OneRule):如果头发长短为长,我们就认为该⼈性别为⼥,如果为短则认为该

⼈性别为男。这是不是很简单?

⽐如下⾯⼀条数据,

虽然⾝⾼为矮,体重为轻,很可能是⼥性,但是我们的唯⼀规则只看头发长度,因为头发长度为短,所以我们的算法判断该⼈性别为男。

总结

这⾥,我只把OneR算法的⼤概故人西辞黄鹤楼书法作品 思想说了⼀下,在实际情况中可能需要⼀些额外的处理,⽐如把连续数据离散化,数据中存在⾮法值(如空

值)如何处理等等,如果你想了解更多,就去找相关的资料看吧,对了,⽬前国锻组词 内⽹站关于数据挖掘⽅⾯的资料还是相对较少的,翻墙吧哈

哈。

更多推荐

oner是什么意思r在线翻译读音例句