个人信息
参与实验室科研项目
复杂环境下非完全信息博弈决策的智能基础模型研究
研究课题
研究非完全信息下,多智能体和人机决策系统中的博弈决策问题,将human-in-the-loop方式与RL和博弈论相结合
学术成果
共撰写/参与撰写专利 0 项,录用/发表论文 1 篇,投出待录用论文1篇。
Conference Articles
-
A Human-Machine Trust Model Integrating Machine Estimated Performance
Shaojun Chen,
Yun-Bo Zhao ,
Yang Wang,
and Junsen Lu
In 2023 6th Int. Symp. Auton. Syst. ISAS
2023
[Abs]
[doi]
[pdf]
The prediction of human trust in machines within decision-aid systems is crucial for improving system performance. However, previous studies have only measured machine performance based on its decision history, failing to account for the machine’s current decision state. This delay in evaluating machine performance can result in biased trust predictions, making it challenging to enhance the overall performance of the human-machine system. To address this issue, this paper proposes incorporating machine estimated performance scores into a human-machine trust prediction model to improve trust prediction accuracy and system performance. We also provide an explanation for how this model can enhance system performance. To estimate the accuracy of the machine’s current decision, we employ the KNN method and obtain a corresponding performance score. Next, we report the estimated score to humans through the human-machine interaction interface and obtain human trust via trust self-reporting. Finally, we fit the trust prediction model parameters using data and evaluate the model’s efficacy through simulation on a public dataset. Our ablation experiments show that the model reduces trust prediction bias by 3.6% and significantly enhances the overall accuracy of humanmachine decision-making.
学位论文
Theses
-
基于人机信任的无人机竞速方法研究
陈少军
中国科学技术大学, 合肥
2024
[Abs]
[pdf]
无人机竞速技术在军事和民用领域展现出广泛应用潜力。在军事领域,无人 机竞速技术可以用于环境极速侦察、实施精准打击等;在民用领域,可以用于灾 难响应救援、工业管道检测等。因此,研究无人机的竞速方法具有重要意义。 竞速环境的复杂性给现有无人机竞速方法带来了挑战。一方面无人机在竞 速飞行中会遇到诸如湍流、阵风等不确定性因素,这种因素是突发、无征兆的, 难以通过概率模型进行建模;另一方面,在多机竞速飞行中,存在着诸如欺骗和 故意阻拦等高级博弈行为,这些行为因其复杂性而难以被精准定量描述。这些困 难会导致无人机自主决策出错,使得竞速效果显著下降。 人机混合决策在无人机竞速领域的应用备受关注,是解决上述挑战的潜在 方向。而人机混合有效决策高度依赖于良好的人机协作关系,否则会出现人类工 作负荷大、忽视机器错误决策等问题。考虑到人机信任起着协调人机协作的关 键作用,将人机信任融入人机混合决策为解决无人机竞速中的挑战提供了可能。 为此,论文提出了适用于无人机竞速场景的人机信任模型,基于该模型,设计了 单机场景和多机场景下的竞速策略。论文的主要研究工作分为以下三点:1)考虑到现有信任模型可解释性差、未能刻画竞速飞行高动态特点,提出 了机器性能驱动的人机信任模型,该模型能够促进人对机器的信任水平和机器 实际能力之间的匹配。首先给出了人机信任所具有的特征以及演化规律;其次, 引入机器当前表现作为机器性能的评估指标之一,构建机器性能驱动的人机信 任模型;最后设计了真实的人机交互实验用于验证所提模型。 (2)针对单机竞速场景中不确定性因素导致无人机竞速效果不佳的问题,提 出了基于人机信任的单机竞速共享控制策略,有效地改善了无人机竞速效果,同 时提升人类的容错率,降低人类工作量。首先设计用于检测人类失误的无人机轨 迹预测模块;其次构建基于人机信任的仲裁机制,实现人机权限的动态分配;最 后在实验平台上验证所提方法有效性。 (3)考虑到多机竞速场景中有着对于高级博弈行为的刻画和实时计算的需 求,提出了基于人机信任的多机竞速强化学习策略,该方法能够实时给出决策指 令,同时提升了机器对于博弈的理解和竞速效果。首先将人机信任作为训练奖励 融入到奖励塑造函数中;其次设计对手轨迹预测网络,增加机器对于对手的策略 理解;最后设计实验验证所提方法有效性。
毕业去向
国家开发银行安徽省分行, 处室处员