抖音日常实习 2月底
一面
- 算法题:全排列。
[a,b,c]求所有排列,用深度优先遍历可求解。 - 算法题: 给定一个有序数组和target,如果能找到target则返回索引,找不到则返回应插入的下标。
可以用二分查找做。 - 问项目:问得很细,然后由项目引申了一些算法知识
- 用户/物品冷启动的策略有哪些
- 加入了一个召回理由后,如何评估对冷启动的效果
- 如何解决新物品的召回和排序
- 用户和物品画像怎么做
- 正负样本不均衡的问题怎么解决
- 正负样本不均衡的话,AUC会失效么,AUC物理意义是什么
- 过/欠采样后,分布是否会有偏移
- 时间序列异常检测的流程
- 随机森林和逻辑回归的原理,这两者输入有何区别?
- c++什么程度,平时代码写的多吗
- 介绍了工作的情况,大概是一半时间python训练模型,一半时间c++修改推荐架构
- 开放题:你即将面试100家公司,每一家公司面试完会给你一个工资package,你只能当场选择接受或者不接受,接受后就不能毁约(不能选择后面的offer),问如何设定策略让自己package最大化。
蚂蚁金服提前批 2月底 通过
支付宝这边算法主要以应用为主,很少做基础研究,我之前做过一些AIops时序的工作,他说和他们比较匹配,然后一二面都聊得比较愉快,很快就通过了提前批。
一面
- 问项目
主要就是我挨个介绍,他提问 - 和我介绍了他们的工作内容
二面
- 问项目
- 我介绍项目,他提问
- Mapreduce的工作原理
- 在搜狗实习每天数据量处理多少,如何处理数据偏移的问题
- 讨论了一下校招正式流程开启后,我选择哪个部门的问题
阿里云提前批 2月底
一面
- 问项目
- 介绍一个收获最大的项目
- 银行数据是什么样的结构
- 我是如何提取时序特征的,为什么这么做
- 你提到你设计了两个算法,那你有考虑后续的改进吗,如何落地如何进一步提高
- C++会吗,介绍一下多态
- python的字典是如何实现的
- 如何解决哈希冲突
- 给你两个文件,每个文件内有100万个不重复的电话号码,如何求两个文件共有的电话号码
- 排序算法常见的有哪些,复杂度如何
- python可以用多线程吗,原理是什么,工作中用到过多进程的,如何解决通信问题
- 介绍了一下他们的工作
阿里云弹性计算部门是最核心的部门,这边主要以开发为主,算法为辅,算法会涉及推荐和负载均衡的问题。 - 给了一个网址让写代码,不是算法题,而是一个具体的应用题。给我了他们实际中会遇到的云服务器的数据,让完成两个子功能,其实就是数据处理。
阿里CBU提前批 3月
一面
- 自我介绍
- 常用的召回算法有哪些
- 常用的排序算法有哪些
- 讲一下如何用graph embedding做召回
- graph embedding中如何做负采样
- 讲一下深度兴趣网络的细节
- 多目标优化有了解吗
- 如何同时对视频、图文做混合排序,视频、图文的特征不完全一致
- 负样本如何有效利用
- 说一下常见排序算法的复杂度
- 给你发个链接,手写一下最大堆排序,输出列表的中位数