赵凡
- 作品数:51 被引量:130H指数:6
- 供职机构:中国科学院新疆理化技术研究所更多>>
- 发文基金:中国科学院西部之光基金新疆维吾尔自治区重点实验室开放课题基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 面向连续时空加油数据的异常检测方法
- 本发明涉及一种面向连续时空加油数据的异常检测方法,该方法涉及面向多个加油站的实时采集数据,基于统计与机器学习相结合,通过预置的基于无监督的时序数据异常检测模块、基于半监督的时序数据异常检测模块和基于多视图的时空深度异常检...
- 马博蒋同海周喜杨雅婷王磊马玉鹏赵凡王轶
- 类自动车牌识别轨迹数据的伴随车辆组挖掘被引量:2
- 2017年
- 自动车牌识别(ANPR)数据比私人全球定位系统(GPS)数据更易获得,且包含更有用的信息,但是相对成熟的针对GPS轨迹数据挖掘伴随车辆组方法并不适用于自动车牌识别数据,现有的少量自动车牌识别数据伴随车辆组挖掘算法存在重视轨迹相似而忽视时间因素的缺陷,因此提出一种基于轨迹特征的聚类方法挖掘伴随车辆组。针对自动车牌识别数据中采样点固定而采样时间不定的特点,通过轨迹中共现的次数判定两个对象构成伴随模式。该共现定义引入豪斯多夫距离,综合考虑轨迹的地点、方向和时间特征,旨在挖掘数据中采样点不同但采样点距离近且轨迹相似的伴随车辆组,以此提高伴随车辆组挖掘效率。实验结果表明,所提方法较现有方法更能有效挖掘伴随车辆组,识别非伴随模式数据,效率提升了近两倍。
- 王保全蒋同海周喜周喜赵凡
- 关键词:豪斯多夫距离共现
- 基于多维时序日志的异常行为可视分析被引量:3
- 2020年
- 当前许多企业面临着来自内部的信息安全问题,由于核心信息的窃取而造成无法估量的损失。企业内部的监控日志数据记录了员工的操作行为与访问记录,通过对内部监控日志进行有效的分析以及时发现员工的异常行为具有重要的意义。然而现有的关于日志分析的方法不能很好地结合多种用户行为日志进行有效分析,并及时发现异常行为提前进行预警。针对这一问题,基于日志的多维性和时序性,提出了一种新颖的可视化系统MLVis。通过设计多个可视化视图,实现一个交互式的可视分析系统,可以帮助决策者发现异常行为,定位异常员工,并分析异常行为之间的联系。采用ChinaVis2018挑战赛I的数据集进行实验和案例分析,验证了该系统的可行性和有效性。
- 张文琦周喜赵凡赵凡
- 关键词:多视图
- 基于改进梯度矢量模型的红外图像分割方法
- 基于改进梯度矢量模型的红外图像分割方法,涉及数字图像处理领域。解决现有方法在进行红外图像分割时,存在噪声敏感,图像弱边界分割泄露,参数选择缺乏自适应性,进而导致的边缘保持与扩大捕获范围之间的失衡等问题,引入引导滤波,根据...
- 赵凡赵建曲锋
- 文献传递
- 面向资源缺乏语言的实体链接系统
- 本发明涉及一种面向资源缺乏语言的实体链接系统,该系统采用基于规则和统计相结合的方法,对维吾尔语词汇进行词干切分和词性标注;根据实体指称项的上下文,对实体指称项进行扩充,通过机器翻译的双语对齐技术,实现汉语和维吾尔语词汇的...
- 蒋同海李晓马博王磊周喜赵凡杨雅婷
- 文献传递
- 用于结核病诊断的检测装置
- 本发明公开了一种用于结核病诊断的检测装置,包括:光源,用于对试剂盒提供背景光照明;光检测模块,与光源相对设置,且试剂盒位于光源与光检测模块之间,光检测模块接收光路经待测反应液后透射的光线并进行颜色采集以输出用于反映颜色值...
- 赵建赵凡张艳超刘建卓
- 文献传递
- 基于R-树索引的高维相似重复记录检测改进算法被引量:3
- 2017年
- 经典的相似重复记录检测算法SNM算法随着记录维度的增加,投影过程不仅会导致数据丢失,算法的误差率也会明显增大.针对SNM算法的不足,提出DRR算法,利用R-树构建索引保留记录的高维空间特性,通过聚类减少记录在叶子节点中的比较次数提高效率,同时改进度量记录相似性的距离算法,避免高维数据稀疏性的影响.最后,通过真实数据在不同维度上分别与SNM算法进行对比,验证了算法的有效性.
- 宋国兴周喜马博赵凡
- 关键词:数据稀疏性
- 基于CNN‐Head Transformer编码器的中文命名实体识别被引量:6
- 2022年
- 基于多头自注意力机制的Transformer作为主流特征提取器在多种自然语言处理任务中取得了优异表现,但应用于命名实体识别任务时存在一字多词、增加额外存储与词典匹配时间等问题。提出一种CNN-Head Transformer编码器(CHTE)模型,在未使用外部词典和分词工具的基础上,通过自注意力机制捕获全局语义信息,利用不同窗口大小的CNN获取Transformer中6个注意力头的Value向量,使CHTE模型在保留全局语义信息的同时增强局部特征和潜在词信息表示,并且应用自适应的门控残差连接融合当前层和子层特征,提升了Transformer在命名实体识别领域的性能表现。在Weibo和Resume数据集上的实验结果表明,CHTE模型的F1值相比于融合词典信息的Lattice LSTM和FLAT模型分别提升了3.77、2.24和1.30、0.31个百分点,具有更高的中文命名实体识别准确性。
- 史占堂马玉鹏赵凡赵凡
- 关键词:命名实体识别
- 一种小样本意图识别方法、装置、设备及存储介质
- 本发明公开了一种小样本意图识别方法、装置、设备以及存储介质,该方法获取意图识别数据集,对数据集进行处理,构建小样本意图识别数据集;提取句子的语义信息,将句子编码为高维特征向量;利用辅助类中样本之间的多样性特征,在高维空间...
- 周喜杨奉毅马博王轶王磊赵凡
- 关键属性组的相似重复记录检测方法研究被引量:3
- 2017年
- 对相似重复记录的检测是数据预处理中的关键环节。针对海量数据相似重复记录检测过程中,记录属性维度过高导致的查准率和时间效率较低的问题,提出了基于统一互信息的关键属性组查找算法,通过过滤噪声属性,降低属性维度。最后,在真实数据集上通过对该算法和基于原始数据所有属性的相似重复记录检测算法在准确率和效率方面的比较,验证了所提出算法的有效性。
- 宋国兴周喜周喜赵凡
- 关键词:相似重复记录