耿筱媛
- 作品数:3 被引量:13H指数:2
- 供职机构:安徽大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于数据挖掘的煤价预测及其质价分析
- 随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。数据挖掘(Data Mining)是从大量的实际应用数据中提取隐含信息和知识,它利用了数据库、人工智能和数理统计等多方面的技术,是一类深...
- 耿筱媛
- 关键词:数据挖掘数据库管理决策树人工神经网络
- 文献传递
- 基于CHI值特征选取和覆盖的文本分类方法被引量:5
- 2008年
- 利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
- 闫屹张燕平耿筱媛
- 关键词:文本处理文本分类
- 改进的K-means算法在电信客户细分中的应用被引量:8
- 2008年
- 在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的。针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度。采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持。
- 耿筱媛张燕平闫屹
- 关键词:数据挖掘聚类算法K-MEANS算法准则函数