针对复杂非结构化三维环境中自主移动机器人(AMR)路径规划的安全性和规划效率问题,基于真实地形模型数据提出了一种融合改进Q-learning(DEM initialization Q-table reward random exploration-exploitation balance Q-learning, DIRRQ-learning)与改进动态窗口法(DWA)的三维路径规划算法。首先利用数字高程模型数据(DEM)来评估地面地形的复杂程度,建立了复杂非结构化的三维环境模型。其次,在三维环境模型的基础上,通过改进奖惩机制和引入地形特征初始化Q值表改进Q-learning,并调整了探索与利用的平衡策略以加快收敛速度,设计了DIRRQ-learning三维全局路径规划算法实现了全局路径规划。在全局路径规划的基础上,针对实时三维环境模型中的未知障碍物通过改进DWA算法,实现动态实时避障的AMR局部路径规划。最后实验结果表明:在全局路径规划方面,DIRRQ-learning相比传统Q-learning算法在路径安全性方面提升了18.2%,收敛速度提高了20.79%;在局部路径规划方面,改进的DWA相比传统DWA算法在路径安全性方面提升了2.4%。因此,提出的三维路径规划算法显著增强了复杂非结构化三维环境中的路径安全性与规划效率,从而提高了AMR的路径规划通行能力与效率。