搜索到260篇“ 不完美信息“的相关文章
并行化完美信息博弈策略生成方法、装置、电子设备以及存储介质
本申请属于机器学习技术领域,具体而言,涉及一种并行化完美信息博弈策略生成方法、装置、电子设备以及存储介质。该方法包括:利用非完全回忆聚类方法,对完美信息博弈的原始特征空间进行压缩,得到抽象特征空间;利用MCCFR最小...
刘启涵杨君梁斌芦维宁陈章
基于深度强化学习的完美信息群智夺旗博弈被引量:2
2023年
复杂环境中群智博弈问题是近年来的研究热点之一.为解决完美信息条件下多智能体夺旗博弈问题,本文提出了一种基于多智能体双重决斗深度Q网络(multi-agent dueling double deep Q-network,MAD3QN)以及图注意力网络(graph attention network,GAT)的多智能体夺旗博弈深度强化学习算法(G-MAD3QN).该算法在实现多智能体在迷宫地图中路径规划的同时,建模完美信息条件下多智能体合作与竞争关系,从而确定夺旗博弈策略.在实验中,本文基于二维迷宫环境,考虑智能体观测信息完美条件,将G-MAD3QN算法与多智能体深度Q网络(multi-agent deep Q-network,MADQN)、MAD3QN等多智能体深度强化学习的基线算法进行对比,从而验证了在二对二夺旗博弈中本文G-MAD3QN算法的有效性.
王健瑞黄家豪唐漾
关键词:不完美信息
计算机博弈中序贯完美信息博弈求解研究进展被引量:3
2023年
计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯完美信息博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中完美信息博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新评估基准,归纳3种研究范式,提出序贯完美信息博弈求解研究框架;然后,着重对序贯完美信息博弈的博弈模型和解概念进行调研,从博弈构建、子博弈和元博弈、解概念以及评估3方面进行简要介绍;接着,围绕离线策略求解,系统梳理算法博弈论、优化理论和博弈学习3大类方法,围绕在线策略求解,系统梳理对手近似式学习、对手判别式适变和对手生成式搜索3大类方法;最后,从环境、智能体(对手)和策略求解3个角度分析面临的挑战,从博弈动力学和策略空间理论、多模态对抗博弈和序贯建模、通用策略学习和离线预训练、对手建模(剥削)和反剥削、临机组队和零样本协调5方面展望未来研究前沿课题.对于当前完美信息博弈求解问题进行全面概述,期望能够为人工智能和博弈论领域相关研究带来启发.
罗俊仁张万鹏苏炯铭魏婷婷陈璟
关键词:计算机博弈对手建模
并行化完美信息博弈策略生成方法、装置、电子设备以及存储介质
本申请属于机器学习技术领域,具体而言,涉及一种并行化完美信息博弈策略生成方法、装置、电子设备以及存储介质。该方法包括:利用非完全回忆聚类方法,对完美信息博弈的原始特征空间进行压缩,得到抽象特征空间;利用MCCFR最小...
刘启涵杨君梁斌芦维宁陈章
文献传递
网络外部性、同伴效应与从众行为——基于完美信息贝叶斯模型的实证研究被引量:10
2020年
数字经济是我国未来发展的重要方向,同伴效应在数字经济发展中起到了非常重要的驱动作用。利用2019年“双十一”网络消费调查数据,基于完美信息贝叶斯决策模型的理论与实证研究表明,同伴效应会对消费者从众行为产生显著的影响,并且这种影响会随着同伴数量的增加而以递减速度增加。进一步数据分析显示,由于网络信息外部性和支付外部性,参与“双十一”活动的同伴数量每增加一位,平均而言会使得消费者参加“双十一”活动的概率提高约8%以上。在使用工具变量法和倾向指数匹配分析处理之后,该结果仍然显著成立。这说明,数字经济的发展存在一定程度的非理性繁荣,要维持数字经济健康持续稳定发展,还需要从政府政策、企业管理和个人决策等方面分别做出优化提升。
习明明
关键词:从众行为贝叶斯模型网络外部性
基于完美信息动态博弈的企业风险处置研究--以S省为例被引量:2
2020年
随着我国经济下行压力加大、产业转型升级加速,企业风险暴露与处置成为当前维护金融稳定面临的一项重要任务。通过构建基于完美信息下的三方动态博弈模型,总结了银企双方博弈和银政企三方博弈下的六种情况。随后,按照整体债务重组、分拆债务重组、整体破产重整、分拆破产重整、破产清算等五种处置模式筛选出S省5家典型企业,运用博弈模型对其进行了详尽分析。结果显示,企业积极配合是银企博弈达到最优解的基本前提,银行合理救助是银企博弈达到最优解的重要保障,政府及时介入是化解银企博弈困境的最终屏障,应从企业、银行、政府三个维度提高企业风险处置效率。
孙毅
关键词:动态博弈政府决策
完美信息博弈中对手模型的研究被引量:2
2019年
针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实验对象,对比研究了2种传统方法和本文提出的2种算法。实验结果表明:策略自扩展算法提高了显式建模的效率和模型准确性。在利用对手弱点获取收益方面,策略自扩展算法比显式建模方法提升了84. 4%,子策略发现算法比隐式建模方法提升了128. 6%。
吴天栋石英
大学生消费信贷市场的完全但完美信息动态博弈分析被引量:1
2019年
近年来,大学生消费信贷市场在以互联网为依托的大背景之下迅速发展,但大学生这个特殊的群体有其特殊性,正是其自身的特殊性使得大学生消费信贷市场风险陡然增加,本文将从大学消费信贷市场对大学生消费信贷市场的完全但完美信息动态博弈进行分析。分析表明,大学生消费信贷市场缺乏有效的约束机制。
李根
完美信息动态博弈下的中小企业融资问题研究
2019年
自改革开放以来,我国市场经济体制的改革也在断的深入与发展,在经济态势大好的环境下,中小型企业也得到了更多的发展空间,逐渐成为国民经济的中流砥柱。但由于市场上存在诸多定性因素,中小企业无法一直处于高速成长的状态。本文针对中小型企业融资难融资贵这一问题,建立完美信息动态博弈模型,分析我国中小企业融资贷款成本以及相应的收益,寻求最优博弈策略,并就分析结果提出缓解我国融资难融资贵问题的相关建议。
罗岚刘璐璐
关键词:信息非对称动态博弈企业融资策略
完美信息计算机博弈的研究与应用
随着计算机科学的高速发展,人工智能技术日益成为学者们的研究焦点。作为检验人工智能发展水平的重要平台,计算机博弈也得到了长足的发展。目前,很多完美信息博弈问题已经得到了解决,而完美信息博弈也在解决完美信息博弈问题过程中慢...
郑建弟
关键词:人工智能计算机博弈投票机制
文献传递

相关作者

高阳
作品数:211被引量:1,325H指数:19
供职机构:南京大学
研究主题:人工智能 HADOOP 多AGENT系统 海量数据 神经网络
陈章
作品数:60被引量:1H指数:1
供职机构:清华大学
研究主题:电子设备 存储介质 多智能体 单轨 智能体
赖玥
作品数:34被引量:68H指数:3
供职机构:广西科技大学
研究主题:财政分权 面板数据 博弈模型 药品市场 乡村
郑炯
作品数:2被引量:0H指数:0
供职机构:吉林大学
研究主题:不完美信息 动态博弈 悖论 审计过程 上市公司会计
梁斌
作品数:480被引量:1,293H指数:20
供职机构:清华大学
研究主题:空间机器人 机械臂 关节 机器人 非合作目标