导航与避障是无人机顺利完成任务的关键环节。然而,传统自主飞行系统在复杂环境中存在局限性,促使研究人员不断探索深度强化学习(DRL)等替代框架。因此,提出了一种基于深度强化学习的新型无人机自主控制算法;为验证所提算法在复杂环境下的性能提升效果,在加泽博(Gazebo)仿真平台的三维(3D)环境中进行了仿真实验。结果表明,该算法不仅融合了深度确定性策略梯度(DDPG)算法的优势,而且实现了对最优比例⁃积分⁃微分(PID)控制器的自学习;该算法在动态环境中的表现优于多种现有算法,具体体现在稳定性提升、响应速度加快及任务成功率提高等方面。