从期末考完开始,到现在为止,折腾了半个多月,总算是拿到了计算所网数实验室的offer,这里来总结一下这其中碰到了种种问题。
总而言之,问题主要包括:机试、数学和项目,三个大主题,首先来谈一下最简单粗暴的数学。
与数学有关的主要包括:
- 微积分
- 线性代数
- 概率论
而与数学有关的东西大都是在大一所学,如果没有针对性的复习,几乎无法应对面试的提问,但短时间内复习完高等数学的三大块内容也不现实,所以这里事后诸葛亮一下,总结自己遇到和可能遇到的一些问题。
线性代数
矩阵的秩的含义
被问到这个问题的时候脑子里一片空白,其实自己只是会计算矩阵的秩,但并不明白其具体含义是什么
矩阵的秩的定义:是其行向量或列向量的极大无关组中包含向量的个数。
那么就可以问下一个问题!(事实上老师也的确是这么做的)
线性无关的意义
$K_n$中如果有向量组$α1,α2,…αs(s≥1)$是线性无关的,那么从式子
$k_1α_1+k_2α_2+…k_sα_s=0$中可以得到
$k_1=k_2=…=0$
从这个定义也可以推导出线性相关的条件,即:$k_1、k_2…$不全为0
所以从个人理解上去解释线性无关,即矩阵内的行(或列)向量无法通过线性运算的方法互相消除。
其实在面试现场的线性代数有关的问题就只遇到了这两个,因为自己实在是只会算但并不理解其意义,所以回答的情况并不理想。
下面再补充一些可能会遇到的问题。
矩阵的特征值/特征向量的意义
从定义出发,特征值和特征向量的定义如下:
$Ax=cx$:A为矩阵,c为特征值,x为特征向量
其意义为:
矩阵A乘以x表示:对向量x进行一次转换(旋转或拉伸)(是一种线性转换),
该转换的效果为常数c乘以向量x(即只进行拉伸)。
这样做的目的通常如下:
我们通常求特征值和特征向量即为求出该矩阵能使哪些向量(当然是特征向量)只发生拉伸,使其发生拉伸的程度如何(特征值大小)。这样做的意义在于,看清一个矩阵在那些方面能产生最大的效果(power),并根据所产生的每个特征向量(一般研究特征值最大的那几个)进行分类讨论与研究。
概率论
概率总是和AI、数据科学贴的非常近,所以面试对于概率论的考核也是一个比较重要的内容,下面罗列一下在面试中遇到的问题。
大数定律是什么
通俗的说,大数定律就是:在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。即用频率代替概率,用样本均值来取代理论均值。
什么是先验概率/后验概率
先验概率:直观理解,所谓“先”,就是在事情之前,即在事情发生之前事情发生的概率,是根据以往经验和分析得到的概率。即通过训练集样本所得的概率。
后验概率:事情已经发生了,事情发生可能有很多原因,判断事情发生时由哪个原因引起的概率。
后验概率涉及到一个重要的计算公式,即贝叶斯公式。
$$
P(A|B) = P(B|A)·P(A) / P(B|A)·P(A)+P(B|C)·P(C)
$$
在B已经发生的情况下,A发生的概率即为P(B|A),此即后验概率。