频繁模式的交互挖掘
给定数据库 DB,假定最小支持度阈值为 s,经过一次挖掘后,得到数据库 DB 中的频繁模式集 FP。当用户对挖掘结果感到不满意时,会改变最小支持度阈 值再次进行挖掘,假设新的最小支持度阈值为 s′,新的频繁模式集为 FP′。
频繁模式的交互挖掘,就是通过已获得的频繁模式集 FP 和更新后的最小支 持度阈值 s′,按照与原来相同的数据库高效发现新的频繁模式集 FP′问题。注意 由于最小支持度阈值的改变,即使数据库没有变化,DB 中在 s 下的频繁模式未 必是 s′下的频繁模式,另一方面,原来在 s 下不频繁的模式,有可能成为 s′下的 频繁模式。概况地说,最小支持度阈值的改变会有三种情况:
1. s′ > s,一些最初的频繁模式可能会成为不频繁的,即 FP′⊆FP;
2. s′ = s,频繁模式没有发生变化,即 FP′ = FP;
3. s′ < s,一些最初不频繁的模式可能会成为频繁的,即 FP⊆FP′。
前两种情况下,频繁模式的更新比较简单直接。因为 FP′⊆FP 且 FP 已知, 所以直接从 FP 中选择那些支持度不小于 s′的模式,就构成新的结果 FP′。第三种 情况下,由于原来不频繁的模式可能会变成频繁的,即 FP⊆FP′,需要重新扫描 数据库获取新的模式频度信息,导致挖掘过程比较复杂。
伪代码
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/103088.html