1.神经网络中有哪些层?
2.前向传播的输出是什么?
3.连续因变量的损失函数与二元因变量和分类因变量的损失函数有何不同?
4.什么是随机梯度下降?
5.反向传播训练是做什么的?
6.在反向传播期间,如何对所有层的权重进行更新?
7.神经网络的哪个函数发生在神经网络训练的每个阶段?
8.为什么在GPU上训练网络比在CPU上训练要快?
9.学习率是如何影响神经网络训练的?
10.学习率参数的典型值是多少?