潘俊
- 作品数:11 被引量:29H指数:3
- 供职机构:温州大学更多>>
- 发文基金:浙江省科技计划项目浙江省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术社会学经济管理电子电信更多>>
- 电信企业通用数据服务平台的设计与实现
- 2013年
- 基于.NET框架设计并实现了电信企业通用的数据服务平台,通过ETL过程对业务数据进行清洗和抽取,建立数据集市;采用SOA架构开发数据服务中间件,作为任务调度和数据集查询的代理;通过可快速配置的自定义智能查询方案,自动生成向导式的用户界面。该平台具有配置快速、安全稳定等特点,可同时为一线人员和经营决策人员提供支撑,已成功投入运行。
- 潘俊程建和
- 关键词:数据服务数据集市联机分析处理
- 加权成对约束投影半监督聚类被引量:2
- 2011年
- 为了充分挖掘成对约束所隐含的信息来指导数据降维和数据聚类,提出一种基于加权成对约束投影的半监督聚类方法.该方法构造成对约束信息的k最近邻集并扩充成对约束集,分析成对约束实例包含的信息量并构造权系数矩阵,在加权成对约束信息的指导下求得投影矩阵,通过投影矩阵将样本数据投影到低维空间,使类内各点紧密分布,类间各点分散分布.同时,通过一种新的评价函数对k均值聚类算法进行改进,能够在尽量不违反成对约束的情况下优化聚类性能,实验结果表明,与现有半监督降维聚类算法相比,新方法能以较低的开销对高维数据进行聚类.
- 潘俊孔繁胜王瑞琴
- 关键词:半监督聚类投影矩阵K均值算法
- 局部敏感判别直推学习机
- 2012年
- 为了充分挖掘样本内在的几何结构和蕴含的判别信息来指导样本数据分类,提出一种局部敏感的判别直推学习方法.该方法将局部敏感辨析(LSDA)的基本原理引入到直推学习中,在直推学习的正则化框架中同时引入有助于分类的样本局部结构信息和判别信息,在判别信息指导下构建了类内图和类间图来刻画类内紧性和类间散性,从而在每个局部邻域中进一步最大化类间样本的间隔.同时,用数学的形式给出了目标函数的解析表达,在几个典型数据集上的实验结果表明,相较传统的基于图的半监督学习算法,该方法能取得更高的分类效果.
- 潘俊孔繁胜王瑞琴
- 关键词:正则化
- 基于WordNet的无导词义消歧方法被引量:7
- 2010年
- 有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性等)描述歧义词的词义信息,生成词义的"代表词汇集"和"领域代表词汇集",结合词汇的词频分布信息和所处的上下文环境进行词义判定.利用通用测试集Senseval-3对6个典型的无导词义消歧方法进行开放实验,该方法取得平均正确率为49.93%的消歧结果.
- 王瑞琴孔繁胜潘俊
- 关键词:词义消歧
- 基于选择性聚类集成的客户细分被引量:10
- 2015年
- 针对数据密集型企业的客户细分问题,提出一种基于选择性聚类集成的客户细分框架。在聚类集体生成阶段,根据数据来源和业务需求构建统一的客户视图,将客户特征划分为若干子集后再分别对客户对象聚类,通过评价函数选择高质量的个体标记向量生成聚类集体;在聚类集成阶段,构建记录簇标记所覆盖的相同对象个数的重叠矩阵,利用重叠矩阵计算各簇权值,最后选择最具代表性的簇参与集成。通过某企业客户细分的实证研究表明,该框架可以有效识别出不同价值和消费行为习惯的客户群,为企业制定产品营销方案提供依据。
- 潘俊王瑞琴
- 关键词:客户细分聚类K均值算法
- 基于多主体系统的多分类直推学习
- 2009年
- 针对少量样本已标记和大量样本未标记的多分类问题,提出了一种新颖的基于多主体系统的直推学习方法。该方法将以Agent表示的样本点随机映射到输出空间构成初始空间格局,空间格局随时间演化的过程是一个自组织的马尔可夫过程,它将在有限时间内达到平稳分布,从而求得最佳的标记分布。根据该方法,给出了两个多主体系统直推学习算法,并讨论了算法的收敛性和复杂度。最后在两个数据集上进行了仿真测试,表明了算法的有效性与实用性。
- 潘俊孔繁胜王瑞琴
- 关键词:直推式学习多主体系统自组织
- 基于多社交数据源的协同推荐方法研究被引量:2
- 2015年
- 协同过滤推荐作为一种有效的推荐方法,普遍存在数据稀疏性和冷启动问题,利用社交网络的多项数据源对协同推荐方法进行了改进。为了克服评分矩阵的稀疏性问题,提出结合用户评分相似度和用户信任度选择推荐邻居,同时对用户相似度计算进行了改进;提出了一种简单有效的信任推理方法,能够识别出用户间隐含的间接信任关系,进一步缓解了数据稀疏性问题;为了解决推荐系统的冷启动问题,提出综合利用项目的类型属性信息和领域专家信息进行联合推荐。实验结果表明,提出的改进策略非常有效,在精度和召回率方面都较已有方法具有明显改善。
- 王瑞琴潘俊李一啸
- 关键词:社交网络个性化推荐信任推理多数据源
- 一种基于工作流的业务流程集成框架
- 2014年
- 提出一种基于工作流的业务流程集成框架,该框架将各应用逻辑视作分布计算环境下的平台组件,采用面向服务的视图,将组件提供的服务封装到适配器中,使用XML消息协调服务间的交互,通过全局工作流引擎控制业务流程.给出了框架的分层架构模型,设计了框架的核心组件:工作流引擎、适配器和消息代理.以企业订单创建流程为例,验证了框架的有效性.
- 潘俊夏慧慧黄海广
- 关键词:工作流引擎适配器消息代理
- 基于结构和约束保持的半监督特征选择被引量:2
- 2014年
- 针对现有特征选择算法较少同时考虑样本的空间结构和先验知识的不足,提出一种基于结构和约束保持的半监督特征选择方法。该方法采用成对约束作为先验知识,同时考虑局部和非局结构,定义了一种新的特征评价准则——结构和约束保持分值。利用大量的无标记样本来学习样本空间结构,利用少量的成对约束信息来学习类内和类间边缘,所选择的特征子集能较好地保持空间结构信息和类属信息。在多个数据集上的实验结果表明,和现有的几种特征排序选择算法相比,所提方法有较好表现。
- 潘俊王瑞琴孔繁胜
- 关键词:半监督学习空间结构先验知识
- 基于信任计算和矩阵分解的推荐算法被引量:6
- 2018年
- 基于矩阵分解的推荐算法普遍存在数据稀疏性、冷启动和抗攻击能力差等问题.针对上述问题,文中提出信任加强的矩阵分解推荐算法.首先,借鉴社会心理学中的信任产生原理,提出基于用户信誉度的信任扩展方法,缓解信任数据的稀疏性问题.然后,基于社交同质化原理,利用信任用户对评分矩阵分解过程中的用户潜在因子向量进行扩展,解决评分数据的稀疏性和新用户的冷启动问题.同时,利用信任关系对目标优化函数进行规格化约束,提高评分预测的准确性.基于通用测试数据集Epinions的实验表明,文中方法在推荐性能方面具有明显改善,可以有效解决数据稀疏性问题和冷启动问题.
- 王瑞琴潘俊冯建军
- 关键词:信誉度信任传递矩阵分解规格化