李晓光
- 作品数:45 被引量:266H指数:9
- 供职机构:辽宁大学信息学院更多>>
- 发文基金:国家自然科学基金辽宁省教育厅高等学校科学研究项目国家教育部“211”工程更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于耦合随机投影的张量填充方法
- 2021年
- 现代信号处理中,越来越多的领域都需要存储和分析规模大、维度高、结构复杂的数据。张量作为向量和矩阵的高阶推广,在保证原始数据内在关系的前提下,可以更为直观地表示大规模数据的结构性。张量填充作为张量分析的一个重要分支,目前已被广泛应用于协同过滤、图像恢复、数据挖掘等领域。张量填充指从被噪声污染或存在数据缺失的张量中恢复出原始张量的手段,文中着眼于当前张量填充技术中时间复杂度较高的缺点,提出了基于耦合随机投影的张量填充方法。该方法的核心包括两个部分:耦合张量分解以及随机投影矩阵。通过随机投影矩阵,文中将原始高维张量投影到低维空间内生成替代张量,同时在低维空间内实现张量填充,进而提高算法的执行效率。同时,所提算法还利用耦合张量分解将填充后的低维张量映射到高维空间,从而实现原始张量的重构。最后,通过实验分析了所提算法的有效性和高效性。
- 杨宏鑫宋宝燕刘婷婷杜岳峰李晓光
- 面向互联网拓扑的非单调半程增长模型
- 2012年
- 互联网拓扑模型的构造,是网络进一步应用和发展的重要研究基础。在现有建模方法中,构成拓扑的节点和连接均为单调增长,显然无法体现网络的真实演化。通过分析长时间跨度的网络实测数据,提取出网络拓扑中节点和连接的消亡与新生规律。在此基础上,进一步修正了拓扑增长的优先倾向概率,并给出一种新的非单调增长的互联网拓扑模型。实验结果说明,在多项重要拓扑特征量方面,该模型均可以很好地体现互联网的动态演化过程。
- 张昕李晓光宋宝燕
- 关键词:互联网拓扑拓扑模型
- GPE:一种基于图模型的NFS有意义结果确定模型
- XML非完全结构查询(NFS)是在缺乏完整的XML文档结构信息情况下的重要查询手段。针对图模型下的NFS有意义结果判断问题,在PE模型基础上提出一种基于图的有意义结果判断模型GPE;针对标签歧义性和复杂的结构语义,GPE...
- 李晓光宋宝燕
- 关键词:NFSXML图模型
- 文献传递
- GPE:一种基于图模型的NFS有意义结果确定模型
- XML完全结构查询(NFS)是在缺乏完整的XML文档结构信息情况下的重要查询手段。针对图模型下的NFS有意义结果判断问题,在PE模型基础上提出一种基于图的有意义结果判断模型GPE;针对标签歧义性和复杂的结构语义,GPE采...
- 李晓光宋宝燕
- 关键词:XML文档网络文件系统结构查询文档结构
- 文献传递
- L(k)-index:一种支持标签路径的高效k双拟结构索引
- 2014年
- 针对基于k双拟的结构索引创建和更新低效问题、查询结果重复验证问题以及标签路径不可获得性问题,提出了一种新的结构索引L(k)-index.L(k)-index通过引入标签路径,在创建时无须k次遍历原数据,并采取批量更新策略,大大提高索引创建和更新的效率,而在空间上仅有很小增加.对于长度大于k+1的路径查询,L(k)-index无须访问原数据进行验证,并支持批量节点的标签路径获得.通过大量实验表明,同A(k)-index相比,L(k)-index创建时间平均提高66.7%,查询处理时间效率平均提高68.9%,批量更新效率平均每节点提高58.8%,而空间仅增加22.5%.
- 李晓光宋宝燕于戈王大玲
- 关键词:XML索引XML查询XML检索
- 面向多领域资源的汉英双语语料库构建的研究被引量:3
- 2008年
- 针对Web上双语资源的多领域性和布局规律性,提出一种拟合多领域特征和位置特征的概率对齐模型。该方法同目前对齐模型相比,在对齐准确率和召回率上分别提高了37%和40.4%。
- 李晓光王鹏张威王大玲
- 关键词:混合模型
- 基于典型样本的卷积神经网络技术被引量:2
- 2020年
- 针对传统卷积神经网络训练过程中,对于全量样本直接进行特征提取会带有过多非关键区分特征使得训练存在模型过拟合、训练收敛慢等问题,提出一种基于典型样本的卷积神经网络TSBCNN。通过部分典型样本生成强化因子指导修正CNN训练,在特征提取阶段更加注重关键区分特征部分,有目的地降低网络训练过程中对非关键特征的学习,有效提高网络训练效果。大量实验结果表明,TSBCNN较传统CNN网络收敛速度和分类准确率有所提高,在一定程度上有效减少过拟合。
- 李晓莉韩鹏李晓光
- 关键词:卷积
- 一种池分区的RFID复合事件探测方法dpool
- 2011年
- 提出一种池分区的RFID复合事件探测方法dpool.该方法针对无用探测负载以及事件顺序发生问题,提出根据探测执行进度渐进式移入相关联事件过滤器的方法,给出了渐进式的规则;针对多查询以及复杂查询易产生过滤器干扰问题,提出查询池和事件池分区方法,给出了池分区的原则;针对事件实例之间的时序距离问题,提出设置动态时间池分区,给出了时间池分区的设置策略.实验表明dpool减少了探测复合事件的响应时间、内存的使用量,使探测的性能得到改善.
- 宋宝燕赵薇王妍石鑫李晓光
- 关键词:RFID
- 流模式下有向近似覆盖图算法研究
- 2019年
- 随着社交网络、交通网络、生物信息网等领域的分析需求快速增长,大规模图数据的处理逐渐成为信息技术领域新的挑战.近似覆盖图技术可以通过选取原图的子图,同时保证子图中任意节点间距离的增加在覆盖因子的约束范围内,从而降低大规模图存储与计算开销.当前相关工作主要研究无向图的近似覆盖图技术,针对于此,提出一种有向近似覆盖图算法,重新定义了簇集以及簇边、桥边、自由边3类关建边,并理论分析基于3类关键边的(3,2)近似覆盖图构建正确性.在此基础上,给出图数据以流模式到达时的近似覆盖图计算算法.算法通过判断边端点的类型进行边的积累聚簇及更新,进而得到全图近似覆盖结果,算法空间复杂度为O(■).最后以基于幂率模型的人工数据集为实验对象,验证算法满足覆盖因子(3,2)的有向近似覆盖图定义,且空间与时间开销较小.
- 张昕李晓光
- 关键词:有向图聚簇数据流
- 基于滑动多窗口的时间序列流趋势变化检测被引量:14
- 2010年
- 趋势变化检测在时间序列流中有着非常广泛的应用.针对可变长的趋势变化检测问题,提出一种基于滑动多窗口的趋势变化检测方法,通过动态生成大尺度窗口,来适应可变长的趋势变化检测.针对内存约束下长趋势变化检测问题,提出一种基于增量PLA的窗口数据近似表示方法,给出了其欧式距离下的误差分析,进而提出一种误差修正方法来降低漏检率.大量实验表明,本文提出的检测方法具有高准确率且时间效率很高.
- 李晓光宋宝燕张昕