董守斌
- 作品数:233 被引量:467H指数:9
- 供职机构:华南理工大学更多>>
- 发文基金:国家自然科学基金广东省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学医药卫生电子电信更多>>
- 一种手机游戏分类方法
- 本发明公开了一种手机游戏分类方法,通过计算不同平台下的游戏的名称、图标和描述简介的相似度,找出同款游戏,统一互联网上16个游戏提供平台的分类体系,按照统一的标准,通过计算游戏的描述简介文本的句子向量相似度和主题分布向量,...
- 董守玲张荣陈海棋董守斌
- 文献传递
- 模板化网页主题信息的提取方法
- 为了消除网页噪音,有效地提取基于模板的网页主题信息,提出了一种新的信息提取方法.该方法采用机器自动学习方式生成网页集的模板;以网页链接关系中的锚点文本作为提取目标对模板进行标记,生成对应模板的提取规则;依据模板的提取规则...
- 欧健文董守斌蔡斌
- 关键词:万维网信息提取搜索引擎
- 文献传递
- 基于主题模型的资源选择算法
- 2017年
- 在具有多个真实搜索引擎的联邦检索环境下,基于小文档的资源选择算法由于难以估计每个搜索引擎的真实网页数量,因此准确率较低.针对这个问题,文中提出了基于主题模型的资源库描述方法,利用LDA主体模型获取每个资源库的描述词;在此基础上提出新的资源选择算法,结合垂直领域权重和词向量计算资源库和查询请求之间的相关度,并根据相关度大小获取最终资源选择结果.实验结果表明,基于主题模型的资源选择算法能很好地提高资源选择效果,可有效应用于分布式搜索引擎的联邦检索环境.
- 董守斌谢一帆袁华陈建豪
- 关键词:分布式检索资源选择主题模型
- 华南理工大学 开源推动校园网应用
- 2006年
- 董守斌
- 关键词:开源软件校园网教学科研信息化建设
- 一种基于云计算平台Spark的变异检测方法
- 本发明公开了一种基于云计算平台Spark的变异检测方法,包括步骤:1)Spark主节点截取部分的输入序列比对映射格式文件,分发到各个Spark工作节点中;2)Spark工作节点并行对上述的片段序列比对映射格式文件进行预处...
- 董守斌吴宗泽袁华付佳兵张铃启
- 文献传递
- 基于ProActive的网格应用程序开发方法被引量:6
- 2005年
- 介绍了基于Java的并行分布中间件工具ProActive,结合网格任务调度器,讨论和给出了用ProActive开发网格和网络应用的方法和过程。实践表明使用ProActive可以方便的开发网格网络应用程序。
- 梁正友张凌董守斌
- 关键词:网格网络PROACTIVE应用程序开发
- 基于免疫算法的文本分类研究被引量:6
- 2007年
- 借鉴免疫的生物学机理,本文提出了一种基于抗体浓度的克隆选择算法,该算法中抗体的选择概率由亲和度与浓度共同决定,具有高亲和度和低浓度的抗体才受到促进。该算法在文本分类领域得到了成功应用。在文本分类的应用中,抗原、B细胞和抗体分别对应训练文本、分类器的一个解和分类器的解与训练文本的亲和度,最后训练完成的分类器含有多个记忆细胞,有效保证了解的多样性。在数据集20_newsgroups上的实验结果显示,该方法的综合性能指标F1可达80.90%,优于Rocchio法与Naive Bayes法。
- 张启蕊张凌董守斌谭景华
- 关键词:文本分类免疫克隆选择
- 基于多视角相关性深度学习的车辆损伤识别方法
- 本发明公开了一种基于多视角相关性深度学习的车辆损伤识别方法,包括1)获取带标签的远、近景车辆损伤图片;2)使用孪生的深度卷积神经网络对远、近景车辆损伤图片进行图像特征提取;3)使用区域建议网络处理图像特征,获取区域建议框...
- 董守斌彭锦波胡金龙袁华
- 基于内容的自主学习式MP3搜索引擎的设计
- 分析了目前MP3搜索引擎的现状,针对现有MP3搜索引擎的不足,构建了基于内容的自主学习式MP3搜索引擎设计模型.提出了搜索引擎的自主学习式信息采集思想、内容信息提取模式和两级数据更新机制,并在华南木棉检索系统中予以实现,...
- 吴云鹏董守斌宋丙林
- 关键词:搜索引擎MP3
- 文献传递
- 基于SMO和指纹技术在线邮件过滤方法与优化被引量:1
- 2009年
- 研究了垃圾邮件的指纹特征向量表示和SVM过滤方法,设计实现了基于指纹特征和SMO的在线式邮件过滤器FSVM,在在线垃圾信息过滤上获得到了与传统方法相当的效果.在SVM过滤的运算速度方面,基于原始SMO算法,对上述在线方法提出了邮件样本动态集方法(DFSVM)进行条件减弱,在降低了计算量的同时能够保证指纹SMO获得相当的过滤效果.在标准测试集和真实邮件系统中进行了实验验证和对比,结果表明,该改进对提高SVM分类精读有一定的帮助.
- 祝庆荣董守斌陈彬
- 关键词:垃圾邮件过滤支持向量机