张永奎
- 作品数:79 被引量:485H指数:12
- 供职机构:山西大学商务学院更多>>
- 发文基金:山西省自然科学基金国家自然科学基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:自动化与计算机技术文化科学理学一般工业技术更多>>
- 突发事件新闻网页的去重方法研究被引量:4
- 2008年
- 随着人们对突发事件新闻的日益关注,需要对其进行有效地分类、索引、加工、处理。参考传统文本处理技术,结合网页结构特征和特定领域文本特征,提出在提取主题内容的基础上,根据突发事件特有的重复规律实现网页去重。实验结果表明,该方法能有效地提高网页去重准确率。
- 罗永莲罗永秀张永奎
- 关键词:突发事件新闻权值计算网页去重
- 文本聚类算法的分析与比较被引量:27
- 2003年
- 聚类是一种重要的数据挖掘形式。介绍了常用的文本聚类算法 ,从各种聚类算法的适用范围、初始参数的影响、终止条件以及对噪声的敏感性等方面对其进行了分析比较。
- 谷波张永奎
- 关键词:中文信息处理文本聚类算法信息过滤知识发现
- 基于遗传算法的费托合成反应动力学模型参数优化被引量:8
- 2001年
- 详细动力学模型是费托合成反应技术从实验室走向工业化过程中最关键的基础研究项目之一。目前对动力学模型的参数估算仍然停留在传统的LM算法上 ,LM算法属于无约束方法 ,在计算中容易因参数越界而使计算失败 ,计算结果强烈依赖于初值 ,且容易陷于局部最优。运用遗传算法来解决费托合成反应详细动力学模型的参数优化问题 ,是一种全新的尝试 ,通过系统的实验我们获得了比较满意的参数估算结果 ,证明该算法用于解决动力学模型参数优化是非常有效的。
- 韩瑞峰张永奎王逸凝徐元源李永旺
- 关键词:遗传算法动力学模型费托合成液化
- 一种基于迭代学习的文本分类器构造方法被引量:1
- 2004年
- 文本自动分类系统是信息处理的重要研究方向。针对文本分错类和相似度低找不到合适类别等两种错误 ,提出一种迭代的学习算法 ,它利用分错的文本向量来提高或降低相应类别向量的权重 ,从而纠正分类错误 ,提高了分类准确率 ,并且最终得到了较精确的类别描述向量和较优的分类器。
- 檀林张永奎
- 关键词:迭代学习文本分类器信息处理特征抽取
- 网上信息检索中BOT站点爬行方法被引量:2
- 2001年
- 简要介绍了 BOT的定义、BOT应用中常用的技术等问题 ,并就作者编制 Show Webmap模块的具体实践 ,说明 Internet上信息检索中的 BOT所使用的站点爬行的方法。
- 孙莉苹张永奎
- 关键词:BOT信息检索INTERNET网页
- 汉语词性自动标注系统的设计与实现被引量:7
- 2001年
- 介绍了汉语词性自动标注系统的设计与实现.该系统实现了统计与规则相结合的方法进行汉语词性自动标注.描述了该系统的总体结构,以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织,特别对稀疏矩阵及其存储方法进行了详细的介绍。
- 王素格张永奎
- 关键词:自然语言理解语料库神经网络
- 视频技术在高速公路收费中的应用
- 2001年
- 现行的高速公路闭路电视监视系统独立于计算机收费系统之外。在增加较少的设备投资的情况下 ,将摄象机的图象数据化 ,同时将图象与计算机收费系统的收费数据实现绑定 ,这一改进更便于收费站监控人员的监控 ,更有利于收费管理人员进行收费稽查。
- 刘锋张永奎
- 关键词:视频技术高速公路收费系统图象采集视频叠加收费站
- 道路交通事故原因的因子分析被引量:2
- 2006年
- 文章运用因子分析的方法,对我国372起道路交通事故的原因进行分析,提取了5个主要因子,并做了相应的解释,结果不仅给道路交通监管部门提出了决策支持,同时对肇事者也有一定的警示作用。
- 杨海霞张永奎
- 关键词:道路交通
- 一种基于多实例的自适应用户模型被引量:12
- 2002年
- 信息过滤中用户兴趣模型的表示是影响过滤精确度的最重要的因素之一。该文提出了一种基于多实例的自适应用户模型,它在一定程度上抑制了传统用户模型表示中同义现象对系统精确度的影响,并且使用户模型具有了关键词自动扩充和自适应能力。
- 李荣陆张永奎
- 关键词:信息过滤遗传算法信息处理计算机
- 交叉语言信息检索研究被引量:1
- 2001年
- 对交叉语言信息检索的模型和特殊的技术要求进行了全面的 分析,开发了一个基于大英百科全书的《哺乳动物》的实验系统。该系统可以用中文检索英 文信息,检索结果用中文表示,较好地验证了这些技术的可行性。
- 王树锋张永奎
- 关键词:信息检索WEB机器翻译INTERNET