当前单一固定式自动体外除颤仪(automated external defibrillator, AED)存在数量不足、覆盖不均的问题,难以同时满足时间、成本方面的需求。为优化AED资源的配置与使用效率,考虑固定式AED、移动式AED、无人机式AED三种方式协同配送,以成本最小、配送时间最小建立双目标AED选址模型。由于该模型属于NP-hard问题,提出了新型多目标深度强化学习模型(novel multi-objective deep reinforcement learning, NMDRL),并针对多目标特点,设计双向协同图注意力机制以及多重最优策略增加Pareto解的多样性和分布性。在四种规模的算例上进行消融实验以及灵敏度分析,验证了双向协同图注意力网络、多重最优策略、门控循环单元各组件的有效性。在三种规模下的对比实验表明NMDRL算法在HV值、IGD值、支配性指标上优于NSGA-Ⅱ、MOPSO以及其他多目标深度强化学习算法,且模型微调步骤可以有效增强算法的多样性和分布性。最后,以上海市杨浦区为研究对象进行数值实验,并针对无人机AED成本参数进行灵敏度分析,验证了模型及算法的可行性,为AED实际布局提供了有效对策。