搜索到954篇“ 主题特征“的相关文章
- 基于三维主题特征测度的新兴主题识别研究
- 2024年
- 识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表示,构建基于时间、引用和关联的三维主题特征指标框架,用于新兴主题识别;并以文本分类领域为例,验证本文方法的可行性与有效性。研究发现,以文献为基本单位表示主题能辅助主题深入挖掘,三维主题特征指标框架具有较好的适应性与扩展性,本文提出的新兴主题识别方法存在泛化应用的参考价值。在理论层面,能为新兴主题识别的相关研究提供一种可参考的方法和思路;在实践层面,可作为一种参考工具应用于科技情报分析、领域发展态势分析等场景。
- 郑德俊程为
- 关键词:主题建模文本分类
- 融合主题特征和交叉注意力的级联信息传播预测方法
- 本发明公开了一种融合主题特征和交叉注意力的级联信息传播预测方法,包括如下步骤:S1,根据级联信息间的差异性进行不同主题特征的划分,并对不同主题特征进行特征提取;S2,根据交叉注意力机制融合用户表示和级联表示以学习特征表达...
- 刘小洋王浩田
- 融合多层次主题特征的文本摘要自动生成方法及装置
- 本发明属于文本数据处理技术领域,特别涉及一种融合多层次主题特征的文本摘要自动生成方法及装置,该方法包括首先基于平均词嵌入方法,将源文本对应的词向量映射成固定长度的句向量;然后将源文本对应的句向量输入到编码器中的双向GRU...
- 何欣陈永超刘红阳于俊洋王光辉
- 一种基于主题特征和内容语义的网页去重方法
- 本发明提供了一种基于主题特征和内容语义的网页去重方法,其特征在于,包括:利用HTML网页标签分类模型自动抽取目标网页的网页正文;基于网页正文进行主题计算和限定;网页相似度计算。本发明提供的方法能够一定程度地解决相关技术中...
- 朱海峰颜小君赵立为
- 技术交叉主题特征识别研究进展
- 2024年
- 技术交叉主题识别研究对于技术创新研究意义重大。本文首先分析了技术交叉的内涵,随后对技术交叉主题识别主要方法进行了系统调研、归纳与分析,最后总结现有研究特点及优劣。研究发现,当前技术交叉主题识别主要方法有信息计量、引文分析、网络分析、文本挖掘、知识图谱、机器学习,涉及弱信号、突破性、颠覆性识别。主要特点包括:1)由形态特征层面的计量测度转向内容特征层面的文本主题挖掘;2)基于技术交叉特性的关联分析、文本挖掘方法等成为主流;3)多种方法与技术结合运用。技术交叉主题识别的未来研究方向包括:深入微观层面主题特征识别;多种方法的综合性创新运用;多元数据融汇;多领域异构大数据融合与应用关键技术。
- 张娴李嘉晖
- 关键词:主题识别网络分析文本挖掘
- 融合主题特征的文本情感分析模型
- 2024年
- 随着大型语言模型的快速发展,如何在保证模型性能的同时减少模型参数量,成为了自然语言处理领的一个重要挑战。然而,现有的参数压缩技术往往难以兼顾模型的稳定性和泛化能力。为此,提出了一种融合主题特征的情感分析新架构,旨在利用主题信息增强模型对文本情感极性的判断能力。具体而言,采用一种结合LDA和K-means的方法来提取文本的主题特征,并将其作为固定维度的向量与词嵌入进行拼接,得到新的词向量表示。随后使用平均池化技术构建句子级别的表征向量,并输入到一个全连接层进行情感分类。为了验证所提模型的有效性,在公开的情感分析数据集上与多个基准算法进行了对比实验。实验结果表明,所提模型在多个数据集上明显优于ALBERT,准确率提高了约3.5%,在参数量仅有微小增加的情况下维持了较高的稳定性和泛化能力。
- 杨俊哲宋莹陈逸菲
- 关键词:情感分析LDA模型主题特征
- 图情档论文主题特征挖掘:基金论文与非基金论文比较分析
- 2024年
- [目的/意义]“图书情报与档案管理”一级学科更名为“信息资源管理”意味着图情档学科的发展迈入了新的阶段。在图情档学科研究稳步推进的过程中,科研基金的资助极大地促进了学科的科研产出。[方法/过程]该文基于关键词共现网络、主题社区划分以及可视化的方法,以CSSCI收录的文献为样本,揭示了图情档学科基金论文与非基金论文的主题结构,归纳和比较了其发展态势。[结果/结论]无基金资助的研究更聚焦图书馆发展理论与具体文化服务、信息服务项目建设,而基金资助的研究则更多关注大数据环境下的新兴计算机技术在图情档学科领域的具体应用。
- 游晟奕张子恒李杰赵艳
- 关键词:基金论文主题结构
- 融合主题特征的长文本分析系统研究
- 杨俊哲
- 基于BERTopic的情报学主题特征及交叉研究
- 随着第四次工业革命的到来,以智能化为特征的学科交叉成为这场变革的重要推动力。在建设创新型国家和实施科技强国战略的驱动下,跨学科研究已然成为支撑国家科技创新发展的关键动力。《新文科建设宣言》中明确了新文科建设的首要目标:打...
- 冯瑞珂
- 关键词:情报学
- 微博平台烟草信息的主题特征及情感倾向分析
- 2024年
- 目的 了解微博用户发布和公众关注的烟草信息的主题特征,并探究各类烟草信息的传播效果,为推动控烟信息的高效传播及效果提升提供理论参考。方法 使用Python软件爬取微博用户发布的烟草信息,采用UCINET软件进行数据分析和共词矩阵分析。结果 经爬取、筛选后共获得6385条烟草信息。其中,烟草信息的关键词整体呈高异质性、广覆盖特征,其频次以“吸烟”“抽烟”居多;正向情感的烟草信息关键词(68.71%)较负向情感(6.98%)多,其频次以“吸烟”“二手烟”居多。结论 微博平台中烟草信息的网络生态整体较好,烟草相关内容占比较小,但具有较强的诱惑性和隐蔽性。相关部门应持续关注烟草流行词汇,并加强烟草危害和控烟法律的宣传,谨防负向情感的烟草信息传播。
- 赵希瑄李艳张露露朱静芬
相关作者
- 余正涛
- 作品数:830被引量:1,193H指数:15
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 机器翻译 跨语言 语料
- 徐俊
- 作品数:176被引量:131H指数:7
- 供职机构:浙江工业大学
- 研究主题:语义 聚类方法 WEB服务 矩阵 单词
- 肖刚
- 作品数:608被引量:811H指数:14
- 供职机构:浙江工业大学
- 研究主题:图像 WEB服务 车牌 电梯 向量表示
- 陆佳炜
- 作品数:355被引量:220H指数:8
- 供职机构:浙江工业大学
- 研究主题:WEB服务 向量表示 语义 聚类方法 图像
- 相艳
- 作品数:228被引量:239H指数:9
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 注意力 情感分析 新闻文本