面试考察
面试确实是因人而异。比如,你想进Google,不管是做全栈还是大数据你都要刷很多题。对System Design的考察也越来越多。但是小公司更多是考Project的经验。 整体面试考察 - Solid understanding of OO Design, Data Structure and Algorithm. 有都会被考到的东西:OO Design,Data Structure and Algorithm,这是大家必须会的。
- Fluent with Software Development Life Cycle. 整个一个Development的Cycle里,Test,Deployment,Release这块都要了解。全栈和Big Data都有自己的一套,这个必须要了解。
- Projects and every single detail of the projects. 当然,当被问到项目的时候,不管是Big Data还是全栈都会被问到大量的细节。比如Design Thinking、Trade-off,还有解决问题的经历。
- 最后,你要在面试中展示出信心。第一,对项目了如指掌的信心,第二,是表现自己是Fast Learner的信心。就算你以前的项目再契合,也不可能和你以后做的工作一样。所以你要展现出:“别管我以前做的什么,你现在交给我什么工作我都能相对独立地快速解决。”
全栈面试题目 要求你非常了解Web Application的结构甚至涉及到DNSC和Load Balance。这一套结构要非常了解。 现在Web Application大量应用单线程的架构,你现在就要了解单线程架构和传统多线程架构的区别和应用场景。 容器在全栈和Big Data里都存在,处理的Serve Purpose都不一样。比如能让你开发更便捷,让开发环境统一,能快速Launch多个Service,让Service之间用SOA通信,而不是传统的Function Call的方式。 - Can you speed up this with multithreading?
- When do we use client-side load balance?
- Design a load balancer without using a centralized load dispatcher.
总的来说,你要能Handle一些Challenge,比如大量用户请求该怎么办?你用Load Balancer,后面怎么跟Server,Server哪些东西你可以Replicate等等各种问题。
大数据面试题目 - 给你一份乱序的100万个数字的文件,你如何来排序?
- What happens when the Kafka node goes down?
- 集群规模变大,文件数增多, NameNode内存受限成为瓶颈,如何解决?
- What are the logics to choose between Mesos and Yarn?
- How does spark treaming work with Kafka?
- How does Kafka manage its offset?
大数据主要还是在数据量上,基本大数据反而是比较简单的问题。这就是为什么Hadoop经常喜欢用WordCount,或者是给一堆数字排序。看上去非常简单,单机的话大家都会,因为都刷过题。只不过当这些数据量增大以后,伴随而来的是非常多单机的时候不会见到的Challenge。这些怎么解决?
当数据上来以后,你的任务节点可能就会死,要怎么Handle,如果是Master成为瓶颈应该怎么解决、Resource Management有不同的特点,Manage不同的Resources该怎么办,这方面的问题都需要了解。
|