文章插图
数据预处理的方法主要有五种:
1、墓于粗糙集( Rough Set)理论的约简方法 。粗糙集理论是一种研究不精确、不确定性知识的数学工具 。现在受到了KDD的广泛重视,利用粗糙集理论对数据进行处理是一种十分有效的精简数据维数的方法 。
2、基于概念树的数据浓缩方法 。在数据库中,许多属性都是可以进行数据归类,各属性值和概念依据抽象程度不同可以构成一个层次结构 , 概念的这种层次结构通常称为概念树 。概念树一般由领域专家提供,它将各个层次的概念按一般到特殊的顺序排列 。
【数据预处理方法主要有数据清洗 数据预处理的方法主要有】3、信息论思想和普化知识发现 。特征知识和分类知识是普化知识的两种主要形式,其算法基本上可以分为两类:数据立方方法和面向属性归纳方法 。
4、基于统计分析的属性选取方法 。可以采用统计分析中的一些算法来进行特征属性的选取,比如主成分分析、逐步回归分析、公共因素模型分析等 。这些方法的共同特征是,用少量的特征元组去描述高维的原始知识基 。
推荐阅读
- 沙蚕钓鱼挂钩方法图解
- 男人最好的减肥方法 男人减肥最好的方法是什么
- 儿童烧烫伤怎么办?儿童烧烫伤的急救方法
- 唇裂怎么治疗 唇裂治疗方法是什么
- 杨梅怎么洗最干净?杨梅的正确清洗方法-食材百科
- 须佐鼬怎么打
- 大蒜钓鱼技巧
- 关于朔州市大数据应用局简述 朔州市大数据应用局
- 红姑娘的功效与作用及食用方法 红姑娘怎么吃
- 黑米如何食用方法 黑米如何食用比较好