苏晓丹
- 作品数:5 被引量:7H指数:1
- 供职机构:解放军信息工程大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce和Bagging的并行组合支持向量机被引量:5
- 2018年
- 为提高大规模支持向量机的运算效率,提出一种基于MapReduce和Bagging的并行组合支持向量机训练算法。该算法包括两个MapReduce流程:(1)分布式并行训练,利用标准SVM算法进行多任务并行的分块训练,保留所有的支持向量,迅速缩减数据集;(2)集成式并行训练,采用Bagging集成算法的思想,结合随机次梯度SVM算法对剩余的支持向量训练,以提高算法的分类精度。实验结果表明,并行组合支持向量机训练算法在保持较高分类精度的基础上,能提高算法运行效率及数据处理能力,能很好地应用于大规模数据集的SVM训练。
- 丁宣宣黄伟郭渊博苏晓丹
- 关键词:支持向量机MAPREDUCEBAGGING
- 开放域事件抽取关键技术研究
- 互联网应用的快速发展使得网络获取的数据量也大幅度的增加。如何快速、高效的从大规模数据中分析出真正有用的信息显得尤为重要而迫切。信息抽取这一研究领域在此背景下应运而生。而事件抽取作为信息抽取的一项子任务,不仅依赖于基础的自...
- 苏晓丹
- 关键词:事件抽取最大熵模型条件随机场模型
- 文献传递
- 开放域事件触发词抽取技术研究被引量:1
- 2017年
- 开放域事件定义与传统事件定义不同,主要以任意领域的事件触发词为核心,并包括与其关联的时间、地点、人物、数量等多种元素构成的结构化数据,是不可预测的。在开放域触发词抽取中,提出了一种基于规则和二值分类相结合的混合模型方法(简称R-Two模型),规则方法需人工构建规则,具有抽取速度快、表征能力强的优点,但也存在规则不完备、过分依赖句法分析的缺点。二值分类法的训练过程虽然比较繁琐,但抽取的准确率高且受句法分析影响小,故将二者融合,并通过实验证明融合方法的有效性。
- 苏晓丹周刚陈海勇丁宣宣
- 一种网络协议识别方法及装置
- 本申请提供了一种网络协议识别方法及装置,方法包括:从网络中抓取已知协议的数据包作为样本数据,并从网络抓取未知协议的数据包作为目标数据包;分别将样本数据包和目标数据包转换为样本纹理指纹特征图像和目标纹理指纹特征图像;构建深...
- 周刚曾琦周艳芳王濛陈海勇兰明敬南煜张凤娟王邠巨星海苏晓丹薛佳瑶
- 文献传递
- 一种网络协议识别方法及装置
- 本申请提供了一种网络协议识别方法及装置,方法包括:从网络中抓取已知协议的数据包作为样本数据,并从网络抓取未知协议的数据包作为目标数据包;分别将样本数据包和目标数据包转换为样本纹理指纹特征图像和目标纹理指纹特征图像;构建深...
- 周刚曾琦周艳芳王濛陈海勇兰明敬南煜张凤娟王邠巨星海苏晓丹薛佳瑶
- 文献传递