湖南科技大学计算机科学与工程学院知识处理与网络化制造湖南省普通高校重点实验室 作品数:8 被引量:30 H指数:4 相关作者: 王弦 黄兴 更多>> 相关机构: 南京大学计算机科学与技术系计算机软件新技术国家重点实验室 南京大学计算机科学与技术系 更多>> 发文基金: 国家自然科学基金 湖南省高校创新平台开放基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 更多>>
融合K-Means与Agnes的Mashup服务聚类方法 从海量的Mashup服务集中快速、准确的找到满足用户需求的Mashup服务,成为一个具有挑战性的问题.在Mashup服务发现中,预先对Mashup服务进行聚类,将大大缩小服务搜索的空间与范围,提高Mashup服务发现的效... 黄兴 刘小青 曹步清 唐明董 刘建勋关键词:网络服务 服务聚类 融合K-Means与Agnes的Mashup服务聚类方法 被引量:8 2015年 如何从海量的Mashup服务集中快速、准确的找到满足用户需求的Mashup服务,成为一个具有挑战性的问题.在M ashup服务发现中,预先对M ashup服务进行聚类,将大大缩小服务搜索的空间与范围,提高M ashup服务发现的效率与精度.本文提出一种新颖的融合K-Means与Agnes的Mashup服务聚类方法(MSCA).该方法,首先对Mashup服务中的Tag标签进行扩充和排序;其次,计算Mashup服务的集成相似性;接着,应用K-Means算法对Mashup服务相似度矩阵进行聚类,找到相似度较高的Mashup服务将其划分到N个原子簇中,再利用Agnes算法对N个原子簇进行层次聚类.最后,从Programmable Web上爬取了13082个Mashup服务作为实验对象,实验结果表明:相比传统的基于K-Means算法的Mashup服务聚类方法,MSCA方法的平均查准率和查全率分别提高了5.18%、5.84%,切实提高了服务聚类及发现的精度. 黄兴 刘小青 曹步清 唐明董 刘建勋关键词:K-MEANS 服务聚类 面向云环境的一种负载感知的服务选择方法 被引量:3 2014年 在云环境下,用户能够方便地按需获取满足其要求的服务资源,而高质量的服务将受到用户的青睐.然而,云环境下的服务请求具有即时、并发以及大规模等特点,多个用户可能同时调用同一个高质量的服务,极有可能出现用户访问量超过服务的负载容量的情况,致使服务负载失衡,从而导致无法即时响应用户请求,服务提供能力急剧下降.针对这一问题,本文提出了面向云环境的一种负载感知的服务选择方法.该方法,首先构建了一个描述用户请求和服务QoS之间关系的用户满意度模型.其次,由服务的负载能力和用户的满意度获得服务的综合得分,并根据服务的综合得分对服务进行排名与选择.最后,在数据集上进行了大规模的实验,实验结果表明:负载感知的服务选择方法能在保证负载平衡的情况下有效地帮助用户选择满足需求的高质量的服务. 王弦 刘建勋 曹步清 唐明董关键词:WEB服务 服务质量 负载平衡 用户满意度 基于Hadoop的业务过程模型管理方法研究 2015年 目前现有业务过程模型研究的共同特点便是基于单机环境来构建业务过程库,并基于传统关系数据库来管理业务过程模型,完成相关的检索、存储等操作。为提高大规模业务过程模型检索与存储的效率,本文提出一种新的业务过程模型管理方法。该方法采用基于Hadoop大数据处理平台对业务过程模型进行管理,并采用Map/Reduce编程框架和HDFS文件系统分别对业务过程模型进行检索和存储,提高了业务过程模型存储效率,减少了模型检索匹配的时间。通过原型系统进行试验验证评估,证明了所提方法在存储和检索效率方面高于单机环境。 卢厅 刘建勋 文一凭 周栋 石敏 陈聪阳关键词:HADOOP 基于信息熵多属性决策的Mashup服务推荐方法 被引量:1 2015年 随着Mashup服务的快速发展,如何在海量的服务集合中找到用户感兴趣的、服务质量高的Mashup服务,成为一个难题。针对该问题,提出一种基于信息熵多属性决策的Mashup服务推荐方法。首先建立用户兴趣模型和Mashup服务的质量(Quality of Service,QoS)模型;其次,利用信息熵多属性决策方法,预测用户对候选Mashup服务的综合评分,并将综合评分最高的Top-K Mashup服务推荐给用户;最后,在不同数据集上进行实验比较与分析,结果表明:基于信息熵多属性决策的Mashup服务推荐方法能够有效地为用户推荐其感兴趣的、高质量的Mashup服务。 王少伟 刘建勋 曹步清 唐明董 王弦关键词:信息熵 多属性决策 基于LDA和模糊C均值的Web服务多功能聚类 被引量:4 2018年 基于Web服务发现方法通常是将Web服务聚在某一个固定的功能类中,导致该Web服务的其余功能特性被忽略,Web服务的资源利用率降低的问题,提出一种基于LDA和模糊C均值的Web服务多功能聚类方法。首先,从ProgrammableWeb.com网站上爬取Web服务数据,并抽取Web服务描述文档;其次,使用LDA主题模型对Web服务描述文档进行建模,获得包含不同功能信息的文档主题矩阵;最后,在文档主题矩阵上使用模糊C均值算法将Web服务聚类到不同的功能类中,完成Web服务的多功能聚类。研究结果表明:Web服务的多功能特性切实提高了服务发现的精度。 张祥平 刘建勋 肖巧翔 石敏 曹步清关键词:WEB服务 模糊C均值算法 WEB服务发现 基于Logistic函数和用户聚类的协同过滤算法 被引量:10 2017年 针对协同过滤推荐算法的数据稀疏性和可扩展性问题,提出一种基于Logistic函数和用户聚类的协同过滤算法.计算用户对服务关键词的偏好度,构建用户-关键词偏好向量,并基于此向量对用户进行聚类;采用Logistic函数计算用户对服务的兴趣度,并根据兴趣度相似性在目标用户所在类内寻找其最近邻居;通过最近邻居预测用户对服务的兴趣度,将兴趣度较高的服务推荐给用户.基于真实数据集的实验证明,与传统协同过滤算法相比,本文算法能取得更高的准确率,且聚类后算法运行时间显著减少,有效地提高了推荐的实时性. 毛宜钰 刘建勋 胡蓉 唐明董关键词:用户聚类 协同过滤 数据稀疏性 基于协程模型的分布式爬虫框架 被引量:5 2014年 网络爬虫主要受到网络延迟和本地运行效率的限制,传统的基于多线程的网络爬虫架构主要为了消除网络延迟而没有考虑到本地运行效率。在高并发的条件下,多线程架构爬虫由于上下文切换开销增大而导致本地运行效率降低,同时使得网络利用率下降,如何能够在最大化利用网络资源的情况下减小系统本地开销是一个需要研究的问题。针对以上问题,本文提出基于协程的分布式网络爬虫框架来解决,从开销、资源利用率、网络利用率上对协程框架和多线程框架进行了分析,并基于协程实现了一个分布式网络爬虫。实验表明该框架无论从开销、资源利用率和网络利用率上相对于多线程框架有比较明显的优势。 杨济运 刘建勋 姜磊 彭桃 文一凭 卢厅关键词:分布式 高性能 爬虫