1. 特征向量与特征值
定义:设
A 为
n 阶矩阵,如果数
λ 和
n 维非零列向量
x 使得关系式
Ax=λx
成立,则称这样的数
λ 为矩阵A的特征值,非零向量
x 称为A的对应于特征值
λ 的特征向量。
上式也可写成:
(A−λE)x=0
这是n个未知数,n个方程的齐次线性方程组,有非零解的充要条件是系数行列式
|A−λE|=0。
由这个
|A−λE|=0 可解出特征值
λ ,然后根据
(A−λE)x=0 可对应某个特征值的特征向量。
题目:
解答:
2. 神经网络的梯度弥散问题
题目:10层的NN训练,反向传播过程中,前三层权值不变,4-6层变化非常慢,这是()现象?
解答:梯度弥散。
梯度弥散的问题很大程度上是来源于激活函数的“饱和”。因为在后向传播的过程中仍然需要计算激活函数的导数,所以一旦卷积核的输出落入函数的饱和区,它的梯度将变得非常小。 随着传播深度的增加,梯度的幅度会急剧减小,会导致浅层神经元的权重更新非常缓慢,不能有效学习。这样一来,深层模型也就变成了前几层相对固定,只能改变最后几层的浅层模型。
扩展:什么是梯度爆炸?
http://blog.csdn.net/cppjava_/article/details/68941436
3. 切比雪夫不等式
切比雪夫不等式定理:

或

。

答案:1/9
4. 无偏估计

参数的样本估计值的期望值等于参数的真实值。估计量的数学期望等于被估计参数,则称此为无偏估计。
这么说吧:同一个总体,一次抽样什么幺蛾子都有可能出现。但是只要你肯一直坚持不懈的抽样下去,每次的样本均值的均值,还等于总体均值——就是无偏的。
上述参考自:
https://www.zhihu.com/question/22983179
一次取平均数就说这是总体的平均值的做法就是:偏差估计。题目中抽了一次样,不属于无偏估计。
5. 统计学问题:儿童智力提升
不太明白解题思路,在知乎上提问:
https://www.zhihu.com/question/64650725
6. 卡方分布
问题:

解答:
设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m) / (X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n.

所以两者相等。
7. 假设检验
题目:

此题涉及
t检验和
显著性检验的概念。
应选C。落在范围之外,可认为有显著不同。
8. 计算行列式的值

参考:《工程数学-线性代数》P12 例7
做法:先化成上三角形行列式,对角线乘积为值。
9. 显著性检验
参见
显著性检验的概念
题目:假定如果假设检验支持我们做出认为某种制造工艺可以降低汽车百公里耗油量的结论,则该新型工艺将正式投入使用。
(1)如果目前制作工艺的汽车百公里耗油为10升,建立合适的原假设和备择假设。
(2)在这种情况下,发生第一类错误和第二类错误的结果是什么?
10. 神经网络的优缺点
答案:参见之前
整理的博文。