程超
- 作品数:2 被引量:4H指数:1
- 供职机构:空军工程大学信息与导航学院更多>>
- 发文基金:陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于聚类加权的文本特征生成算法被引量:3
- 2013年
- 目前的文本特征生成算法一般采用加权的文本向量空间模型,该模型使用TF-IDF评价函数来计算单个特征的权值,这种算法生成的文本特征冗余度往往都比较高。针对这一问题,采用了一种基于聚类加权的文本特征生成算法,首先对特征候选集进行初始加权处理;然后通过语义和信息熵对特征进行进一步加权处理;最后使用特征聚类对冗余特征进行剔除。实验表明该算法比传统的TF-IDF算法的平均分类准确率高出5%左右。
- 张凤琴王磊张水平王鹏程超
- 关键词:文本分类权值计算特征聚类信息熵
- 一种应用于DaaS的物化视图候选集生成算法被引量:1
- 2012年
- 针对DaaS数据中心建设中物化视图选择对候选视图集的新要求和传统MVPP方法的不足,提出一种新的候选视图集生成算法。该算法利用多操作变换规则进行查询优化,然后利用算法1和2进行关系融合。实验证明,该算法能够提高查询效率,压缩候选视图集,具有较高的可扩展性,符合应用需求。
- 张水平程超王蓉张凤琴陈爱网
- 关键词:面向服务体系架构物化视图