叶娜
- 作品数:4 被引量:44H指数:2
- 供职机构:东北大学信息科学与工程学院计算机软件研究所更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于反馈学习自适应的中文话题追踪被引量:26
- 2006年
- 在话题追踪研究领域,由于话题是动态发展的,在追踪过程中会产生话题漂移的问题。针对该问题以及现有自适应方法的不足,本文提出基于反馈学习的自适应方法。该方法采用增量学习的思想,对话题追踪任务中的自适应学习机制提出了新的算法。该算法能够解决话题漂移现象,并能够弥补现有自适应方法的不足。该算法中还考虑了话题追踪任务的时序性,将时间信息引入到了算法中。本文实验采用TDT4语料中的中文部分作为测试语料,使用TDT2004的评测方法对基于反馈学习的自适应的中文话题追踪系统进行评价,实验数据表明基于反馈学习的自适应方法能够提高话题追踪的性能。
- 王会珍朱靖波季铎叶娜张斌
- 关键词:计算机应用中文信息处理
- 基于改进型Dotplotting的文本分割模型
- Dotplotting是文本分割领域的著名算法,本文在对Dotplotting算法改进的基础上,提出了 MMS模型。原始的Dotplotting算法仅考虑了语义段落间相似度来进行分割,而MMS模型综合考虑语义段落内部相似...
- 叶娜罗海涛郑妍朱靖波张斌
- 关键词:文本分割
- 文献传递
- 基于二维动态规划的文本分割模型
- 本文提出一种全局优化的文本分割模型,其中设计了基于语段内部词汇相似度、语段间词汇相似度和语段长度的分割方式评价函数,并采用二维动态规划来寻找全局最优解。模型基于如下假设:语段内部词汇相似度越大,语段间词汇相似度越小,语段...
- 叶娜郑妍朱靖波张斌
- 关键词:文本分割
- 文献传递
- 基于多元判别分析的文本分割模型被引量:18
- 2007年
- 提出了一种独立于具体领域的文本线性分割统计模型,其中采用多元判别分析方法定义了4种全局评价函数,实现对文本分割模式的全局评价,寻找满足分割单元内距离最小化和分割单元间距离最大化条件的最好分割方式.该模型采用遗传算法来解决新模型的高计算复杂度问题.比较性实验结果显示,新模型比TextTiling和Dotplotting算法取得了更高的Pμ评价性能.
- 朱靖波叶娜罗海涛
- 关键词:文本分割多元判别分析遗传算法