摘要:CUDA是应用较广的GPU通用计算模型,在人工神经网络模型中,BP算法是目前应用最广泛的一种模型之一。本次设计的目的是设计一个基于CUDA的人工神经网络,了解并理解并行计算的基本原理,掌握CUDA编程方法。本文中提出了用CUDA平台模型来并行化BP算法的方法。用该方法训练BP神经网络,训练开始之前,将数据传送到GPU上,训练开始后计算隐含层和输出层的输入输出误差,更新权重和偏倚的过程都在GPU上实现。BP算法是利用输出层的误差来估计输出层的直接前导层的误差,再用这个误差估计前更一层的误差。如此下去,就能获得所有的其他各层的误差估计。这样就形成了将输出端表现出的误差沿着与输入信号传送相反的方向逐渐向网络的输入端传递的过程。因此人们又将此算法称为向后传播算法,简称BP算法。
关键词:CUDA;BP神经网络;并行计算;VS
目录
摘要
Abstract
1-BP神经网络-1
1.1 BP神经网络的基本原理-1
1.2-BP算法-1
1.2.1 模式顺传播-1
1.2.2 误差的逆传播-2
1.2.3 记忆训练-4
1.2.4 学习收敛-4
1.3 BP网络的解析步骤-4
2并行计算-5
2.1并行计算的概念-5
2.2并行计算的基本原理-6
2.3并行计算的现状及应用情况-6
3 GPU编程-7
3.1 GPU简介-7
3.2 GPU并行计算架构-7
4 CUDA编程-9
4.1 CUDA简介-9
4.2 CUDA编译环境的安装-9
5 BP神经网络系统数学原理及算法-10
5.1 BP网络的数学原理-10
5.2 BP神经网络的算法-15
结 论-15
参 考 文 献-16
致 谢-18
附录A 程序(调研报告)-19