前言
这学期实验室和阿里杭州总部的手淘项目组有一个合作项目,主要工作内容是做一个淘宝私域场景下的6宫格推荐,一个强化学习方法在推荐场景下的应用研究。
最近研一结束,也赶上了需要项目对接的时间,想着可以去找一下实习了,毕竟上一份在腾讯的挂牌实习工作也临近结束,寻思着腾讯经历完了,还是想去阿里再看看的。
于是提交了简历,然后约了面试,按流程来看整个面试共有三轮,昨晚进行的是第一轮,由我们项目进场对接的负责人直接面我。
基本情况
- 面试部门:阿里巴巴及蚂蚁集团-手机淘宝-商品推荐项目组
- 面试岗位:(强化学习推荐)算法岗
- 个人情况:本人的简历情况如下,按照最后面试官的直接反馈来看,这样的简历卷阿里的算法岗应该是问题不大的
面试回忆
全覆盖面
- 能不能分别解释一下独立和不相关?
- 度量分布间差异的方法有哪些?使用KL散度时需要注意什么问题?
- 什么是线性可分?如果训练数据线性不可分应该怎么处理?
- 为什么要区分验证集和测试集?
- 在机器学习的优化中,影响收敛速度的因素有哪些?
- 如何改进GD去让它逃离鞍点,为什么?
- 如何在一个大块连续平缓的空间内,设计梯度优化方法能让它逃离?
- 简单讲述高斯混合模型的原理?
- 如何判断现有数据是否适合用GMM建模或拟合?分别讲述实践层面和理论层面的理由?
- 对于现在深度学习模型的“堆叠”现象,你怎么看?
- 考虑一个ctr预估问题,我们知道ctr=点击数/曝光数,那么如果有一个商品在过去七天仅获得了10次曝光,恰好被点了1次,那么他的ctr会达到10%,这是一个很高的离群数据,在实际应用中应该怎么处理?
- 对点击数sum_click整形特征的使用,在喂进深度模型之前需要对其进行预处理成服点特征,我提供两种思路,一是进行减均值除方差进行标准正态化处理,二是进行特征分筒,请叙述一下选择二者之一的理由以及为什么不选择另一种?
简历面
- (前一天晚上)能把你发表的文章给我发一份看看么?
- (针对文章)在延迟反馈的奖励建模部分,你使用了importance sampling的方式,能说明这个w系数的定义方式和训练过程么?
- (针对文章)训练w的数据是如何构造的?
- (针对文章)使用这种方法看起来是对Y=1的数据奖励做了一个单向不可逆的放大操作,这样做的理由是什么?
- (针对文章)在即时和延迟奖励部分使用0/1,这看起来对于某些数据所带来的奖励会相互抵消,请问这样做的理由是什么?
- 我看你的简历上以科研项目和奖学金为主,没有看到有机器学习和算法竞赛之类的经历,是你在发展中有意思的这么安排的么,还是说出于某些考量你避开了竞赛类经历的参与?
自由面
- 请谈一谈一个你遇到过的重大挫折以及你是如何克服的?
- 请说出你在某一件事情上因为自己的表现或发挥让整个团队效益得到提升的经历。
- 你说你是一个比较喜欢自由工作模式的人,那为什么还会参加学生会,去做这种需要给固定的组织举办固定活动的经历,这似乎与你的初衷不符。
- 好了我没问题了,接下来你有什么想问我的么?
反问
- 现在组内的工作节奏和气氛是怎样的,考勤和休息政策如何?
- leader对于实习生有哪些指导和规划?
- 您是怎么看待开发岗和算法岗的?
总结
阿里的算法岗面试有一套很严格的流程,面试几乎会涵盖所有方面的所有内容,对于科研项目经理较为广泛的我的简历来说,最适合的应该如面试官所说,应该奔着算法岗去,这样的简历在开发岗面试中可能并不是一个有竞争力的产品。