国家教育部博士点基金(20060290508)
- 作品数:33 被引量:198H指数:8
- 相关作者:夏士雄张磊牛强周勇孟凡荣更多>>
- 相关机构:中国矿业大学华南理工大学中国科学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金江苏省社会发展科技计划更多>>
- 相关领域:自动化与计算机技术矿业工程更多>>
- XML加密数据查询方法的研究与设计被引量:4
- 2010年
- 充分利用XML数据库文档的结构特性,结合Dewey编码的编码原理,设计了一种数据服务(DAS)模式下的XML加密数据的查询算法(ILISA)。将树型结构上的数据检索变换为顺序链表的数据检索,应用插值搜索算法替代深度与广度优先遍历,带来了良好的时间复杂性。设计了一种XML索引表数据结构,使得检索空间大幅缩减。最后给出ILISA的复杂性描述,证明了该算法具有良好的效果。
- 柯于义夏士雄汪楚娇
- 关键词:数据服务XML加密数据查询电子商务
- 一种半监督局部线性嵌入算法的文本分类方法被引量:10
- 2010年
- 针对局部线性嵌入算法(LLE)应用于非监督机器学习中的缺陷,将该算法与半监督思想相结合,提出了一种基于半监督局部线性嵌入算法的文本分类方法。通过使用文本数据的流形结构和少量的标签样本,将LLE中的距离矩阵采用分段形式进行调整;使用调整后的矩阵进行线性重建从而实现数据降维;针对半监督LLE中使用欧氏距离的缺点,采用高斯核函数将欧氏距离进行变换,并用新的核距离取代欧氏距离,提出了基于核的半监督局部线性嵌入算法;最后通过仿真实验验证了改进算法的有效性。
- 夏士雄李佑文周勇
- 关键词:局部线性嵌入算法半监督学习流形学习文本分类核函数
- OLAM体系结构和算法的研究及应用被引量:3
- 2008年
- 联机分析挖掘(OLAM)把OLAP(联机分析处理技术)和DM(数据挖掘)统一起来,从而在数据库或数据仓库的不同层次进行挖掘。为了提高联机分析挖掘的效率,论文给出了基于OLAP和DM的OLAM系统的一体化模型,并且通过研究数据挖掘方法和联机分析处理技术各操作的特点,对传统的DM算法进行了一定的改进,提出了更有效的基于OLAP的关联规则挖掘算法。
- 陈佩佩孟凡荣郑中珮
- 关键词:联机分析挖掘联机分析处理关联规则算法
- 基于领域本体的学习资源语义检索模型被引量:8
- 2008年
- 为解决e-learning领域内学习资源的有效检索,提出了一个基于领域本体的e-learning学习资源语义检索模型。用Protégé构建了教育技术领域本体,通过对检索方法的研究分析和算法实现,开发了基于本体语义检索原型系统;并由对比全文检索和基于本体的语义检索两种方法的查准率,证明了基于本体的语义检索方式,在一定程度上能解决目前传统检索中存在的不足。
- 牛强邱波夏士雄周勇张磊
- 关键词:E-LEARNING学习资源领域本体语义检索
- 基于语义划分的多层关联规则冗余处理方法被引量:1
- 2010年
- 针对多层次关联规则的冗余问题,提出基于语义划分的多层关联规则冗余处理方法.该方法根据语义描述信息将冗余规则划分为三类:子规则冗余、同义规则冗余、可规约规则冗余.冗余处理的时候删掉冗余子规则,对同义规则进行归类视为具有相同意义的规则,把只表述了部分信息的可归约规则规约到更高层次.使用某手机订阅服务的真实数据进行实验,实验表明该方法能有效地对规则进行冗余处理.
- 李帆夏士雄张磊王志愿
- 关键词:多层关联规则本体
- 具有特征语义权重的数据聚类方法被引量:1
- 2011年
- 针对聚类中的特征选择问题,提出一种基于特征语义权重的数据聚类方法。该方法由用户指定必需的特征集,通过计算特征之间的语义相关度,选择和指定特征集相关的特征集作为补充。利用语义相关度确定各个特征的语义权重,在特征语义权重计算的基础上对传统的K-Means聚类算法进行改进,提出具有特征语义权重的FSW-KMeans算法。实验结果表明,FSW-KMeans算法较大地提高了聚类算法准确率和效率。
- 周川祥孟凡荣张磊王志愿
- 关键词:本体语义相关度
- VR-tree索引结构的轨迹Stop区域快速发现
- 2011年
- 移动对象轨迹stop区域发现是轨迹数据分析的一个重要方面.提出基于VR-tree的轨迹stop区域快速发现方法.首先选择一条轨迹使用DBSCAN算法得到stop区域,把它们作为其他轨迹的stop区域候选,构建VR-tree;然后,对于剩余每条轨迹,先与VR-tree比较,找到与其中的stops相交的区域,标记轨迹包含在这些区域中的点,再对轨迹中其他点使用DBSCAN算法得到新的stops,并将它们作为其他轨迹的候选插入到VR-tree中.每条轨迹的stops由与VR-tree比较获得的stops和新stops区域按照区域覆盖率合并得到.实验使用真实数据集,证明本方法与基于密度的轨迹stop发现方法相比,不仅能很好发现轨迹stops,而且效率提高近60%.
- 李雯夏士雄张磊
- 基于多聚类结果融合的轨迹聚类方法被引量:1
- 2011年
- 针对轨迹聚类结果的不可靠性,提出一种基于多聚类结果融合的轨迹聚类方法MRMTC.对于多聚类器产生的多个聚类代表轨迹,提出了轨迹合并算法,实现了多个聚类代表轨迹的合并.代表轨迹合并算法以平均扫描线距离函数作为共识函数,通过共识函数对代表轨迹间的相似度进行比较,最后合并相似的代表轨迹.实验表明基于融合的轨迹聚类方法,可以获得比单一聚类更有效更稳定的聚类结果.
- 李静张磊韩陈寿
- 关键词:聚类聚类融合
- 基于模糊理论的不确定轨迹模式挖掘被引量:2
- 2011年
- 轨迹模式挖掘是轨迹数据知识发现的一个重要课题.由于定位设备的局限性,采集到的轨迹数据具有不确定性.着眼于不确定轨迹数据模式挖掘,通过引入模糊集方法,提出不确定轨迹数据模式挖掘方法.首先用均匀网格划分对象的运动平面,基于对象实际位置的概率分布计算轨迹点相对于每个网格的隶属度,通过不确定轨迹兴趣区域发现算法,得到所有的不确定兴趣区域,然后在此基础上进行轨迹模式挖掘.实验展示了所提出的不确定轨迹数据模式挖掘方法进行模式挖掘的效果.
- 李帆夏士雄张磊
- 关键词:模糊集网格
- 基于语义划分的多层关联规则冗余处理方法
- 针对多层次关联规则的冗余问题,提出基于语义划分的多层关联规则冗余处理方法.该方法根据语义描述信息将冗余规则划分为三类:子规则冗余、同义规则冗余、可规约规则冗余.冗余处理的时候删掉冗余子规则,对同义规则进行归类视为具有相同...
- 李帆夏士雄张磊王志愿
- 关键词:多层关联规则本体
- 文献传递