王新
- 作品数:36 被引量:146H指数:7
- 供职机构:云南民族大学数学与计算机科学学院更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术文化科学历史地理更多>>
- 一种改进的基于Geo-tagged照片的热门旅游景点挖掘方法被引量:2
- 2018年
- 采用熵过滤方法对Geo-tagged照片进行数据处理,主要考虑游客与居民对旅游活动的影响不同,提出识别特定区域的地理位置用户是游客还是居民的方法.通过改变网格映射方式,提出一种改进的基于Geo-tagged照片的热门旅游景点挖掘方法,并与现有聚类算法进行了分析比较,结果表明改进的算法具有更好的时间性能和延展性.最后,通过获取flickr上带有云南省地理标注的旅游照片,对该方法进行了仿真实验,有效地挖掘得到云南省排名前12的旅游景点.
- 方伟欣王新
- 关键词:聚类算法
- 一种挖掘负关联规则的有效方法被引量:6
- 2011年
- 负关联规则表示2个项集之间的互斥或否定关系,往往隐藏在数量庞大的非频繁项集中,有很强的相关性且包含了重要的信息.提出了一种基于相关系数和最小兴趣度的挖掘负关联规则的方法,并给出了相应的算法,实验表明该算法能有效提高挖掘效率.
- 张雅芬王新
- 关键词:数据挖掘负关联规则相关系数
- 基于社区专家用户权威度的微博推荐算法研究被引量:2
- 2020年
- 针对微博推荐方法存在效率不高、数据稀疏等问题,首先将用户交互级别与用户专业知识水平作为用户信任程度;其次融合改进的平台认证指数,用户活跃度和用户影响力3种因素,得到用户权威度;最后结合用户的信任关系和微博用户的权威度选出专家用户集,计算专家用户的兴趣相似度进行推荐,改进了基于社区专家用户权威度的微博推荐算法.实验结果表明,改进的推荐算法能有效地提高准确率、召回率和F1值.
- 马倩王新郑承宇王婷
- 基于模板的XML文档表示技术研究被引量:3
- 2008年
- 大体积XML文档包含大量的冗余数据,因此它在网络上传输时存在有效传输效率低、浪费带宽等问题.针对大体积XML文档在网络上传输所存在的问题,提出了一种基于模板的XML文档表示方法,经实验证明本方法在一定程度上提高了大体积XML文档网络有效传输效率.
- 黄立冬王新施国兴陆歌皓
- 关键词:XML
- 一种基于信息表的关联规则挖掘方法被引量:2
- 2010年
- 在Apriori算法中,需要多次扫描数据库,并且对候选集的支持度计算比较繁琐,本文利用等价关系的概念,在信息表上计算候选集的支持度计数并寻找频繁项集,且只需扫描数据库1次,提高了挖掘效率,同时保留了包含频繁项集的事务.
- 汪际和陈平王新
- 关键词:等价关系关联规则信息表
- 一种结合用户相似度的社会化推荐算法被引量:1
- 2019年
- 在对现有的概率矩阵分解算法研究的基础上,针对其中只使用评分信息来做预测存在较大误差的问题,提出了一种结合用户相似度的社会化推荐算法(SRUS).首先,以概率矩阵分解算法(PMF)为基础,结合用户相似度信息进行建模;其次,使用潜在特征空间将评分矩阵和相似度矩阵关联到一个统一的框架中;最后,对这2个矩阵进行矩阵分解,实现算法的优化推荐.将这一算法与PMF算法进行比较,实验表明,SRUS算法在数据稀疏性、冷启动和精确性方面具有更优的效果.
- 郑英丽王新马倩解雪琴
- 关键词:矩阵分解
- 基于数据增强的小样本图像分类方法被引量:1
- 2023年
- 小样本图像分类训练样本过少,若直接用深度学习的方法对其处理会出现过拟合现象,且存在训练好的模型不能很好的泛化到测试任务上等问题.针对以上问题,提出一种基于数据增强的算法去缓解模型过拟合,并结合深度学习网络wide-ResNet28来提升模型的分类性能.此方法没有引用外部数据对当前任务进行数据扩充,而是借助基类数据的语义先验信息对新类数据的特征进行补充,在形成新的特征分布上进行数据增强.该方法在MiniImageNet和Cub 2个小样本数据集上进行实验,图像特征提取的精确度分别达到83.46%、91.61%,验证了该方法的有效性.
- 尹甜甜王新邓亚萍施国兴
- 关键词:图像分类
- 基于已存信息的知识发现更新方法被引量:1
- 2006年
- 在挖掘关联规则和序列模式过程中,用户往往需要多次调整最小支持度,才能获得有趣的关联规则和序列模式.现给出基于已存信息的知识发现更新方法———PSI算法和大PSI-seq算法,以提高挖掘知识的效率.
- 王新
- 关键词:知识发现关联规则
- 一种基于多标签传播的重叠社区挖掘算法
- 2015年
- 在众多社区挖掘算法中,标签传播算法因为接近线性时间复杂度被广泛应用,但其也存在大量随机性,稳定性差的问题,采取一种新型的多标签策略解决重叠社区挖掘问题,并根据节点度减少初始标签赋予量的方法提升了算法的稳定性.
- 黎凡王新李华梅朱思敏朱芹
- 基于覆盖运算的代表关联规则挖掘被引量:1
- 2006年
- 在大型数据库项目之间挖掘出的关联规则数常常是巨大的。为缩减关联规则表示,该文基于覆盖运算的定义,讨论如何从已知关联规则导出其它关联规则,指出存在能覆盖全部关联规则的代表关联规则集,最后给出计算代表规则的算法。
- 王新
- 关键词:数据挖掘