17个机器学习的常用算法!(12)
2021-06-05 22:36 算法与数学之美
FP Growth是一种比Apriori更高效的频繁项挖掘方法,它只需要扫描项目表2次。其中第1次扫描获得当个项目的频率,去掉不符合支持度要求的项,并对剩下的项排序。第2遍扫描是建立一颗FP-Tree(frequent-patten tree)。
接下来的工作就是在FP-Tree上进行挖掘,比如说有下表:
它所对应的FP_Tree如下:
然后从频率最小的单项P开始,找出P的条件模式基,用构造FP_Tree同样的方法来构造P的条件模式基的FP_Tree,在这棵树上找出包含P的频繁项集。
依次从m,b,a,c,f的条件模式基上挖掘频繁项集,有些项需要递归的去挖掘,比较麻烦,比如m节点。
—版权声明—
来源:图灵人工智能,编辑:nhyilin
仅用于学术分享,版权属于原作者。
若有侵权,请联系微信号:Eternalhui或nhyilin删除或修改!
—THE END—
☞14岁考入北大少年班,如今节衣缩食上课穿胶鞋,却慷慨资助贫困生
☞细数二十世纪最伟大的10大算法
☞10部关于数学的顶级纪录片
☞假如地球变成甜甜圈形状,世界会变成什么样子?
☞应用数学的强大威力
☞丘成桐:本科教育怪事多
官方微信公众号:掌酷门户(wapzknet)
相关资讯
新闻热点
精选美图