
4.5 粗糙近似算子的构建与多粒度多标记模型
4.5.1 多粒度标记粗糙集知识表示模型
传统数据挖掘仅从数据中挖掘得到单一粒度层次上的知识,而人类的知识表达和问题求解往往是建立在综合的多粒度结构上的,因而应该在多粒度知识空间上进行有效的知识发现。研究首次提出了多粒度标记数据的粗糙集知识表示和知识获取理论模型,给出了多粒度标记信息系统和决策表的概念,得到了多粒度标记决策信息系统在不同粒度下的属性约简、最优粒度选择和多层次IF-THEN规则获取方法。该研究突破了传统粗糙集数据挖掘方法仅能获取单一粒度知识的局限,为数据的多粒度表示和知识发现奠定了理论基础。
4.5.2 粗糙集理论和证据理论
研究进一步给出了粗糙集理论和证据理论之间的相互表示,发展了基于粗糙集的不确定测度理论。证据理论最初是由Dempster在1967年提出的,Shafer在1976年进一步将该理论系统化成专著,故证据理论又称为Dempster-Shafer证据理论。该理论最基本的信息粒度结构是由mass函数生成的信任结构,由信任结构可以导出一对对偶的称为信任函数与似然函数的数值型测度。粗糙集理论的基本信息粒度结构是由论域及定义在其上面的二元关系所构成的近似空间,它导出一对称为下近似算子和上近似算子的非数值型集合算子。该理论揭示了模糊和随机环境下粗糙集理论中的上近似算子与下近似算子和Dempster-Shafer证据理论中的似然函数与信任函数之间的本质联系,发现并证明了不精确概念的模糊粗糙下近似集和上近似集的概率正是不精确概念的模糊信任测度与模糊似然测度;反之,模糊环境下任何由信任结构导出的一对对偶的模糊信任函数与模糊似然函数都可以表示为某个概率近似空间的模糊下近似概率与模糊上近似概率。该研究为使用粗糙集理论研究证据结构提供了独特的方法,也为证据决策知识的发现构建了理论模型,为使用证据理论的同时处理含有模糊和随机两种不确定性信息系统的知识获取提供了新的方法。
4.5.3 粗糙近似算子公理化
研究人员用构造性方法和公理化方法定义了多种具有较强应用背景的粗糙近似算子,系统地构建了基于模糊信息粒度的模糊粗糙近似算子的理论框架体系。构造性方法的研究成果为研究模糊信息系统的知识获取与基于模糊信息的决策提供了理论依据与方法。公理化方法为进一步使用粗糙集理论分析拓扑结构、代数结构、可测结构等粗糙集信息粒度的数学结构在方法论上提供了较好的手段,为探索基于粗糙集理论的近似推理研究奠定了重要理论基础。
4.5.4 多粒度模式知识发现的数据建模方法
研究发展了基于优势关系、相容关系及三角模等复杂信息系统的多粒度模式知识发现的数据建模方法,为求解更加合理、更加满意的决策规则提供了多角度、多层次的分析方法。为了获得整体数据集或问题的全局解,需要对多个单一粒度上发现的模式进行融合,将人类的多粒度认知能力引入到复杂数据建模中,从粒度计算的角度出发,将经典粗糙集方法中的单个等价关系(单个粒度)弱化为多个优势关系(多个粒度),提出了基于优势关系、相容关系及三角模等复杂信息系统的多粒度粗糙集模型,建立了复杂信息系统中的乐观和悲观多粒度模糊粗糙集模型,并深刻探讨了它们的性质,讨论了复杂信息系统中乐观和悲观多粒度模糊粗糙模型之间的关系,以及它们与单粒度模糊粗糙集之间的区别和联系,通过研究其上下近似的性质及度量解决了对实际问题中多条件的目标刻画问题;进一步结合贝叶斯决策论得到了复杂信息系统的多粒度决策粗糙集模型,为具体实践应用提供了一种全新的决策工具。