中午午睡中,迷迷糊糊接到电话开始面试:
基础题目:引用和指针的区别,囧,只能回答出来一个引用一定要赋初值,指针定义的时候不用。其实还有引用的值是引用那块地址的别名,而指针是直接指向一块地址等区别,google有很多答案的
1. 给你一亿个用户数据,根据用户ID,让你大概分到20个组内。大概就是hash的做法。。
2. 有很多字符串,放在不同的文件中,因为内存不足以存储所有的字符串,让你找出出现频繁的top10个字符串。在面试官GG的引导下,才说出了用上面分组的办法,先把数据hash到不同的组,这样每个组互相之间都是独立的,接下来就分别对每个组找top10,然后再综合找top10就行了。
3. 给你用户的购买历史单据,然后让你预测用户下一次可能购买的东西。我的做法是,先对商品分类别,再具体问题具体分析。
总结,阿里面试的还是大数据题目居多~~~