나는 원래 이것을 소프트웨어 엔지니어가 되기 위한 짧은 연구 목록으로 만들었다. 그러나 지금 당신이 볼수 있듯이 이 목록은 매우 커졌다. 이 목록을 숙지 한 후, 나는 아마존에 소프트웨어 엔지니어로 채용됐다! 당신은 아마 내가 한 것처럼 많이 공부할 필요는 없을 것이다. 어쨌든 당신이 필요로 하는 모든 것은 여기에 있다.
여기에 나열된 목록들은 아마존, 페이스북, 구글, 마이크로소프트 같은 거대 기업을 포함한 거의 모든 소프트웨어 회사의 인터뷰를 준비하는데에 도움이 될것이다.
행운을 빈다!
코딩 인터뷰 대학은 (컴퓨터공학 학위 없이 독학한) 웹 개발자에서 큰 회사의 소프트웨어 엔지니어가 되기 위한 나의 몇 달간의 공부 계획이다.
이 글은 신입 소프트웨어 엔지니어 혹은 소프트웨어/웹 개발에서 (컴퓨터과학 지식이 필요한) 소프트웨어 엔지니어링으로 전환자고자 하는 사람들을 위한 글입니다. 만약 당신이 여러 해의 소프트웨어 엔지니어링 경력이 있다면, 더 어려운 인터뷰가 예상된다.
만약 당신이 여러 해의 소프트웨어/웹 개발 경험을 가지고 있다면, 구글과 아마존, 페이스북 그리고 마이크로소프트과 같은 큰 규모의 소프트웨어 회사들은 소프트웨어 엔지니어링을 소프트웨어/웹 개발과 다르게 바라보고 있으며 컴퓨터과학 지식을 요구한다는 사실에 주목하도록 하자.
믿음직한 엔지니어 혹은 시스템 엔지니어가 되고 싶다면, 선택적인 주제 목록(네트워크, 보안 등)을 더 공부하도록 하자.
- 코딩 인터뷰 대학이란?
- 이걸 왜 써야하죠?
- 어떻게 쓰면 되나요?
- 당신은 충분히 똑똑합니다
- 영상 자료에 관하여
- 인터뷰 과정 & 전반적인 인터뷰 준비 과정
- 인터뷰를 위한 언어 고르기
- 도서 목록
- 시작하기 전에
- 다루지 않을 것
- 먼저 알아야 할 지식
- 하루 하루의 계획
- 알고리즘 복잡도 / Big-O / 점근적 분석
- 자료구조
- 추가 지식
- 트리
- 트리 - 배경지식
- 이진 탐색 트리(BST)
- 힙 / 우선순위 큐 / 이진 힙
- 균형 탐색 트리 (간단한 개념)
- 트리 순회: 전위 순회, 중위 순회, 후위 순회, 너비 우선 탐색(BFS), 깊이 우선 탐색(DFS)
- 정렬
- 선택 정렬
- 삽입 정렬
- 힙 정렬
- 퀵 정렬
- 병합 정렬
- 그래프
- 방향 그래프
- 무방향 그래프
- 인접 행렬
- 인접 리스트
- 그래프 순회: 너비 우선 탐색(BFS), 깊이 우선 탐색(DFS)
- 더 많은 지식
- 네트워크
- 시스템 디자인, 확장성, 데이터 핸들링 (4년 이상 경력자를 위한 주제)
- 최종 검토
- 코딩 문제 연습
- 코딩 연습/도전
- 인터뷰가 얼마 남지 않았을 때
- 이력서
- 인터뷰가 다가오면 생각해보기
- 면접관에게 받았던 질문들
- 취직했다면
---------------- 여기부터는 선택사항입니다. ----------------
- 추가 도서
- 추가 주제
- 컴파일러
- 부동 소수점 수
- 유니코드
- 엔디언
- Emacs 와 vi(m)
- 유닉스 명령어 도구
- 정보 이론
- 패리티 & 해밍코드
- 엔트로피
- 암호기법
- 압축
- 네트워크 (만약 당신이 네트워크에 대한 경험이 있거나 시스템 엔지이너가 되고 싶다면 받을 수 있는 질문들)
- 컴퓨터 보안
- 가비지 콜렉션
- 병렬 프로그래밍
- 메세징, 직렬화, 그리고 큐잉 시스템
- A* 알고리즘
- 고속 푸리에 변환(FFT)
- 블룸 필터
- HyperLogLog
- Locality-Sensitive Hashing
- van Emde Boas 트리
- Augmented Data Structures
- 트라이(Tries)
- N-ary (K-ary, M-ary) trees
- 균형 탐색 트리
- AVL 트리
- Splay 트리
- 레드블랙 트리(RBT)
- 2-3 탐색 트리
- 2-3-4 트리(aka 2-4 트리)
- N-ary (K-ary, M-ary) 트리
- B-트리
- k-D 트리
- 스킵 리스트
- 네트워크 플로우(유량)
- 분리집합 & 유니온 파인드(Disjoint Sets & Union Find)
- 빠른 프로세싱을 위한 수학
- 트립
- 선형 계획법
- 기하학, 볼록 껍질
- 이산수학
- 기계학습
- 몇몇 주제에 대한 세부사항
- 영상 자료
- 컴퓨터 과학 강의들
- 라이센스
내가 이 프로젝트를 시작했을 때, 나는 힙이나 스택, 시간복잡도, 트리, 그래프 순회 등에 대하여 전혀 아는 바가 없었다. 만약 내가 정렬 알고리즘을 코딩해야 했다면, 나는 그리 잘하지 못했을 것이다. 모든 사용했던 모든 자료 구조는 언어 안에서 구현되어 있던 것들이고, 나는 그것들이 보이지 않는 곳에서 어떻게 작동하고 있는지 몰랐다. 나는 실행 중인 프로세스가 메모리 초과 에러를 메시지를 보내지 않는 한 메모리를 관리할 필요가 없었고, 나는 해결책을 찾아야만 했다. 나는 몇몇 다차원 배열이나 연관 배열을 사용해왔지만, 자료구조를 처음부터 구현해본 적은 없었다.
하지만 이 공부 계획을 진행하면서 나는 내가 고용될 것이라는 자신감을 갖게 되었다. 이 것은 내게 여러 달이 필요한 긴 계획이다. 만약 당신이 이 중 많은 내용에 익숙하다면 시간은 훨씬 덜 들 것이다.
How to use it?
아래의 모든 것은 대략적인 개요이며 당신은 위에서 아래 순서대로 진행해야 한다.
이 문서는 진행 상황을 확인하기 위한 목록 작성부터 다른 곳에도, Github식 마크다운 문법을 사용하고 있다.
새 브랜치를 만들어서 중괄호에 x표를 넣는 식으로 항목을 체크하라: [x]
브랜치를 포크하고 아래의 명령을 따라라
git checkout -b progress
git remote add jwasham https://github.com/jwasham/coding-interview-university
git fetch --all
끝났으면 박스에 x로 체크하라
git add .
git commit -m "Marked x"
git rebase jwasham/master
git push --force
- 성공한 소프트웨어 엔지니어들은 똑똑합니다. 하지만 그들 조차도 자신들의 지적 능력면에 대해서 불안감을 갖기 일쑤입니다.
- 천재 프로그래머에 대한 미신(迷信)
- 위험한 홀로서기: 테크 산업의 보이지 않는 괴물들의 전쟁
- Believe you can change
몇몇 영상들은 Cousera, Edx, Lynda.com 클래스에 등록하여야만 시청이 가능합니다. 이것들은 MOOCs라고 불리는데요. 강의가 없는 경우에는 몇 달 동안 기다려야 할 수도 있습니다. Lynda.com 강좌들은 무료가 아닙니다.
여러분이 YouTube 온라인 강의 동영상과 같이 무료이고 항상 접근 가능한 동영상 소스들을 추가해주면 정말 감사하겠습니다.
저는 대학 강의 듣는 것을 좋아합니다.
인터뷰 과정 & 전반적인 인터뷰 준비 과정
-
코딩 인터뷰 정복 Set 1:
-
Big 4에 취업하는 방법:
-
준비 코스:
- 소프트웨어 엔지니어 인터뷰 대공개 (유료 강좌):
- 전직 구글 면접관이 당신이 어떻게 소프트웨어 엔지니어 인터뷰를 준비해야 하는지 알려줍니다.
- 자료 구조, 알고리즘 그리고 면접을 위한 파이썬! (유료 강좌):
- 자료 구조와 알고리즘, 모의 면접 등을 다루는 파이썬 중점 면접의 준비 강좌입니다.
- 소프트웨어 엔지니어 인터뷰 대공개 (유료 강좌):
인터뷰때에 당신이 쓰기에 편한 언어를 선택해도 되지만, 큰 기업들은 보통 아래의 언어들을 선택합니다.
- C++
- Java
- Python
아래 언어들을 사용할 수 있지만 주의하여야 합니다.
- JavaScript
- Ruby
당신은 당신의 언어에 매우 익숙하고 그 언어에 대해 잘 알아야 합니다.
언어 선택을 도움이 될 만한 읽을 거리들
- http://www.byte-by-byte.com/choose-the-right-language-for-your-coding-interview/
- http://blog.codingforinterviews.com/best-programming-language-jobs/
제가 공부하고 있는 C, C++, Python 강의를 아래서 볼 수 있습니다. 아래를 보시면 관련된 책들이 몇 개 있습니다.
아래의 목록은 내가 공부했던 책들보다는 적다. 당신의 시간을 절약하기 위해 몇몇 책들은 생략하였다.
- Programming Interviews Exposed: Secrets to Landing Your Next Job, 2nd Edition
- C++ 과 JAVA 문제의 답변을 위해서
- Cracking the Coding Interview 책을 위한 좋은 사전학습용 책이기 때문에
- 어렵지 않고, 당신이 인터뷰에서 마주할 대부분의 문제들 보다 쉽기 때문에
- Cracking the Coding Interview, 6th Edition
- JAVA 문제의 답변을 위해서
만일 당신이 많은 여유 시간이 있다면:
- Elements of Programming Interviews (C++ version)
- 모든 코드가 C++로 되어있다, 만일 당신의 인터뷰에서 C++를 사용하길 고려한다면 정말 좋은 책이다.
- 일반적인 문제들을 해결하기 위해 좋은 책이다.
- Elements of Programming Interviews (Java version)
- Write Great Code: Volume 1: Understanding the Machine
-
이 책은 2004년에 출판된 다소 구식의 책이지만, 간략히 컴퓨터를 이해하는 데에 훌륭한 자료입니다.
-
이 책의 저자는 HLA를 발명했습니다. 그래서 회의적인 시선으로 HLA에 대해 언급하고 예로 듭니다. 널리 읽히지는 않지만, 어셈블리가 어떻게 생겼는 지를 보여주는 좋은 예입니다.
-
이 장들은 당신에게 탄탄한 기초를 세워줄 것입니다:
......
- Chapter 2 - Numeric Representation
- Chapter 3 - Binary Arithmetic and Bit Operations
- Chapter 4 - Floating-Point Representation
- Chapter 5 - Character Representation
- Chapter 6 - Memory Organization and Access
- Chapter 7 - Composite Data Types and Memory Objects
- Chapter 9 - CPU Architecture
- Chapter 10 - Instruction Set Architecture
- Chapter 11 - Memory Architecture and Organization
-
만약에 시간적 여유가 좀 더 있다면 아래 서적을 읽어보는 것을 권유합니다.
- Computer Architecture, Fifth Edition: A Quantitative Approach
- For a richer, more up-to-date (2011), but longer treatment
인터뷰를 위해 당신의 언어를 선택하여야 합니다 (윗글 참조) 아래는 제가 추천하는 언어들입니다. 이 언어들중에 부연설명이나 부가 자료들이 있다면 나눠 주세요.
이 중 하나를 읽으려면 코딩 문제 푸는 데 필요한 데이터 구조 및 알고리즘 지식이 있어야합니다.
검토(review)를 좋아하지 않는다면, 이 프로젝트의 모든 영상은 생략해도 됩니다.
Additional language-specific resources here.
C++
나는 아래의 두 책들을 읽지 않았습니다. 하지만 Sedgewick이 높게 평가한 책들입니다. 그는 정말 대단한 사람입니다.
- Algorithms in C++, Parts 1-4: Fundamentals, Data Structure, Sorting, Searching
- Algorithms in C++ Part 5: Graph Algorithms
C++에 대한 더 나은 추천 책이 있다면 알려주십시오. 포괄적인 자료를 찾고 있습니다.
Java
- Algorithms (Sedgewick and Wayne)
- videos with book content (and Sedgewick!) on coursera:
또는:
- Data Structures and Algorithms in Java
- by Goodrich, Tamassia, Goldwasser
- UC버클리 대학의 CS입문 과정의 선택 텍스트로 사용됨
- 아래에서 Python 버전에 대한 나의 책 보고서를 참조하십시오. 이 책은 동일한 주제를 다루고 있습니다.
Python
- Data Structures and Algorithms in Python
- by Goodrich, Tamassia, Goldwasser
- 나는 이 책을 사랑한다. 이 책은 모든 것을 다룬다.
- Pythonic code
- 나의 열렬한 서적 보고서: https://startupnextdoor.com/book-report-data-structures-and-algorithms-in-python/
어떤 사람들은 이 책들을 추천한다. 하지만 만약 당신이 소프트웨어 엔지니어링 분야에 오랜 경험이 있고, 그로 인해 훨씬 더 어려운 인터뷰를 볼 것이라 생각하지 않는다면, 나는 이 책들을 공부하는 것이 너무 과하다고 생각한다:
Optional Books
-
Algorithm Design Manual (Skiena)
- As a review and problem recognition
- 알고리즘 카탈로그 부분은 면접에서 다루는 난이도의 범주를 훨씬 넘깁니다.
- 이 책은 2개의 파트가 있습니다:
- class textbook on data structures and algorithms
- 장점:
- is a good review as any algorithms textbook would be
- 산학과 연구에서 문제들을 해결한 그의 경험을 이야기하는 것이 좋음
- 예제 코드가 C언어
- 단점:
- CLRS처럼 너무 함축되어 있어서 헤아리기 힘들 수 있다. 그래서 어떤 주제는 CLRS를 읽는 게 더 나을 수도 있다.
- 7, 8, 9장은 따라가기 힘들 수 있다. 어떤 항목들은 설명이 잘 안되어있거나 더 많은 배경 지식이 필요하기 때문이다.
- (오해하지 마세요) 전 Skiena씨와 그 분의 교육 스타일과 매너리즘은 좋아합니다만, 스토니브룩 대학의 자료는 그렇지 않더군요.
- 장점:
- 알고리즘 카탈로그:
- 이게 이 책을 사는 진짜 이유
- about to get to this part. Will update here once I've made my way through it.
- class textbook on data structures and algorithms
- 아마존 킨들에서 도서 대여 가능
- Answers:
- Errata
-
- 중요: 이 책을 읽으면 특별한 가치를 얻을 수 있습니다. 이 책은 알고리즘과 자료구조를 훌륭하게 살피고 있지만, 좋은 코드를 작성하는 법을 알려주지는 않습니다. 괜찮은 솔루션을 코드로 효율적으로 옮겨적을 줄 알아야합니다.
- CLR 또는 CLRS로 알려져있습니다. (역: 저자들 이름의 첫글자를 따서 CLRS라고 불리지만, 초판에는 Stein이 없었습니다.)
-
- 처음 두 장은 (데이터 테이프를 사용한 아주 오래된) 문제를 프로그래밍하는 기발한 솔루션을 보여줍니다. 하지만, that is just an intro. This a guidebook on program design and architecture, much like Code Complete, but much shorter.
-
"Algorithms and Programming: Problems and Solutions" by Shen- 좋은 책. 하지만 몇 페이지 넘기면서 문제를 해결한 후에 파스칼, do while 반복문, 1-indexed 배열, unclear post-condition satisfaction results를 보고 좌절했다.
- 다른 책이나 온라인 코딩 문제에 있는 코딩 문제를 보는 게 나을 것 같다.
이 문서는 몇 달간 계속 업데이트 되고 있으며, 그런 이유로, 내가 감당할 수 없어지기 시작한 듯하다.
내가 저지른 몇 가지 실수들을 소개한다. 이를 통해 당신은 이 과정을 좀 더 효과적으로 진행할 수 있기를 바란다.
나는 수 시간의 비디오를 보고 방대한 양의 노트를 작성했지만, 몇 달 뒤에는 대부분의 내용을 기억하지 못했다. 나는 3일 동안 내가 작성한 노트를 보고 flashcard를 만들면서 내용들을 다시 검토해야 했다.
꼭 읽고 내가 한 실수들을 반복하지 않길 바란다.
Retaining Computer Science Knowledge
이 문제를 해결하기 위해 나는 2가지 종류(일반적인 내용, 코드)의 flashcard를 보관하고 추가할 수 있는 작은 사이트를 만들었다. 각 카드는 다른 서식을 가지고 있다.
이 사이트는 모바일에 최적화 되어있기 때문에 내 전화기나 태블릿 어디에서든 이를 확인할 수 있다.
당신만의 카드를 무료로 만들어보자:
앞에서도 언급했듯이 나는 불필요하게 많은 것을 공부하려고 했고, 내 카드의 내용들은 어셈블리 언어와 Python의 자잘한 지식들부터 기계 학습과 통계학까지 넘나들게 되었다. 결국 기업이 요구하는 것보다 훨씬 멀리 가버리고 말았다.
flashcard에 대한 참고사항: 답을 할 수 있더라도 처음부터 안다고 표시하지 말자. 정확히 알기 전까지는 같은 카드를 보고 여러 번 답변할 수 있어야한다. 반복 학습을 통해 해당 지식은 당신의 뇌에 깊이 각인될 것이다.
나의 flashcard site를 사용하는 대신 Anki를 사용해도 된다. 나는 이 것을 여러 번 추천받았다. 이것은 당신이 기억하는 것을 돕기 위해 반복적인 시스템을 사용한다.
이것은 사용자 친화적이며, 모든 플랫폼에서 사용가능하다. 또한 클라우드 동기화 시스템을 제공한다. 이것은 iOS에서는 $25이지만 다른 플랫폼에서는 무료로 사용 가능하다.
Anki format의 내 flashcard 데이터베이스: https://ankiweb.net/shared/info/25173560 (thanks @xiewenya)
나는 ASCII, OSI 구조, Big-O 표기법 등에 관한 일련의 치트시트를 만들어 놓고, 여유 시간이 날 때마다 공부한다.
30분 동안 프로그래밍 문제를 해결하고, flashcard를 살펴보자.
주의를 산만하게 만드는 많은 것이 있으며, 이것들은 우리의 귀중한 시간을 뺏어간다. 주의를 집중하는 것은 힘든 일이다.
이 기술들은 널리 퍼져 있는 기술이지만, 여기서 다루는 부분은 아닙니다:
- SQL
- Javascript
- HTML, CSS, 그리고 다른 프론트엔드 기술들
어떤 주제들은 하루가 걸리고, 어떤 것들은 며칠이 걸릴 것이다. 또 어떤것은 구현할 것들이 없이 그냥 배우는 것들이다.
아래 리스트에 있는 것에서 매일 하나의 주제를 택했고, 그 주제에 대한 강의를 보고, 구현을 했다:
- C - 인자를 가지는 구조체와 함수 사용
- C++ - 빌트인 타입 사용하지 않음
- C++ - 링크리스트를 위한 STL's std::list 같은 빌트인 타입 사용
- Python - 빌트인 타입 사용 (파이선 연습을 계속 하려고)
- 제대로 하고 있는지 테스트를 했고 가끔은 간단한 assert() 사용
- 당신은 아마 자바나 그 어떤 언어를 이용하겠지만 이것은 그냥 내 것들이다.
당신은 이것을 다 할 필요는 없다. 단지 [인터뷰를 위한 하나의 언어를 할 것.](#인터뷰를 위한 언어를 하나 골라 두어라).
왜 이 모든것을 코딩해야 하는가?
- 나는 이것에 미칠때까지 연습하고 또 연습했고, 아무런 문제 없이 할 수 있게 되었다 (어떤 것들은 다양한 케이스가 있고 이것을 기억하기 위해 기록을 보관했다.)
- 있는 그대로의 제한 속에서 연습 (garbage collection의 도움없이 메모리 할당과 해지 (파이선 빼고))
- 빌트인 타입을 사용하여 나는 빌트인 도구에 대한 경험이 있게 되었다. (내 프로젝트의 링크 리스트 구현은 쓰지 않을 예정)
모든 주제에 대한 모든 것을 할 수 없지만 나는 노력했다.
나의 코드를 여기서 확인하세요:
- [C] (https://github.com/jwasham/practice-c)
- [C++] (https://github.com/jwasham/practice-cpp)
- [Python] (https://github.com/jwasham/practice-python)
당신은 모든 알고리즘에 대해서 기억할 필요는 없다.
컴퓨터에 코딩하지 말고 와이트보드나 종이에 적어보아라. 인풋 값으로 샘플 테스트를 해 보아라. 그리고 컴퓨터로 테스트해 보아라.
Prerequisite Knowledge
-
C언어 배우기
- C 는 어디에나 있다. 당신은 책이나 강의, 비디오 등 공부하는 동안 모든 곳에서 예제를 볼 것이다.
- C Programming Language, Vol 2
- 이 책은 분량이 적은 책이지만 C언어를 잘 다룰 수 있게 해 줄 것이다. 또한 조금만 연습하더라도 연습량에 비해 빠르게 배울 수 있을 것이다. C언어를 이해하는 것은 프로그램과 메모리가 어떻게 돌아가는지 이해하는 것을 도와준다.
- 질의 응답
-
컴퓨터가 프로그램을 어떻게 처리하는 지:
Algorithmic complexity / Big-O / Asymptotic analysis
-
구현할 것은 없다.
-
Big O Notation (and Omega and Theta) - best mathematical explanation (video)
-
Skiena:
-
TopCoder (includes recurrence relations and master theorem):
-
일부 강의가 너무 수학적이라면, 아래로 가서 이산 수학에 대한 동영상을 보며 배경 지식을 쌓아보세요.
Data Structures
-
- 자동 리사이징 벡터 구현하기
- 설명:
- 벡터 구현하기 (자동 리사이징을 포함한 동적 배열):
- 배열, 포인터 및 인덱싱 대신하여 특정 인덱스에 접근하는 포인터 연산을 통한 코딩 연습
- 메모리 할당을 포함한 새 배열
- 배열 메소드 등의 기능을 활용하지 않으면서 정수 배열에 메모리를 할당할 수 있어야 함
- 16으로 시작하거나 시작하는 숫자가 크다면 2의 제곱수(16, 32, 64, 128)로 시작
- size() - 항목의 개수
- capacity() - 들어갈 수 있는 항목의 최대 개수
- is_empty()
- at(index) - 인덱스에 있는 항목을 돌려주고, 인덱스가 범위 밖이면 에러를 냄
- push(item)
- insert(index, item) - index에 item을 삽입하고 기존 인덱스의 값부터 쭉 오른쪽으로 쉬프트
- prepend(item) - 맨 앞에 원소를 삽입
- pop() - 마지막 원소를 삭제하고 값을 돌려준다
- delete(index) - delete item at index, shifting all trailing elements left
- remove(item) - looks for value and removes index holding it (even if in multiple places)
- find(item) - looks for value and returns first index with that value, -1 if not found
- resize(new_capacity) // private 함수
- 용량이 꽉 차면, 그 두배로 크기를 조정한다.
- item을 하나 꺼낼 때, 용량이 1/4이라면, 용량을 절반으로 줄인다.
- 시간 복잡도
- 접근, 수정, 끝에 추가/삭제하는 데 O(1)
- 다른 곳에 추가/삭제하는 데 O(n)
- 공간 복잡도
- 메모리에 연속적으로 있어서, 근접성이 성능을 향상시킨다.
- 필요한 공간 = (n 이상인 배열의 용량) * item의 크기, 하지만 2n 크기에서는 여전히 O(n)
-
- 설명:
- C Code (video) - 전체 영상은 아니고, 노드 구조와 메모리 할당에 대한 부분입니다.
- 연결 리스트 vs 배열:
- 왜 연결 리스트를 기피해야 하는지 (영상)
- 짚고가기: 이중 포인터에 대한 지식이 필요하다면: (for when you pass a pointer to a function that may change the address where that pointer points) 이 페이지는 포인터가 포인터를 가리키는 것을 파악하는 정도입니다. 저는 아래 목록을 순서대로 읽지 않기를 권장합니다. 가독성과 유지 보수성이 더 좋기 때문입니다.
- 구현 (저는 tail 포인터가 있는 것과 없는 것 모두 구현했었습니다.):
- size() - returns number of data elements in list
- empty() - bool returns true if empty
- value_at(index) - returns the value of the nth item (starting at 0 for first)
- push_front(value) - adds an item to the front of the list
- pop_front() - remove front item and return its value
- push_back(value) - adds an item at the end
- pop_back() - removes end item and returns its value
- front() - get value of front item
- back() - get value of end item
- insert(index, value) - insert value at index, so current item at that index is pointed to by new item at index
- erase(index) - removes node at given index
- value_n_from_end(n) - returns the value of the node at nth position from the end of the list
- reverse() - reverses the list
- remove_value(value) - removes the first item in the list with this value
- 이중 연결 리스트
- 설명 (영상)
- 구현할 필요는 없습니다.
-
- Stacks (video)
- Using Stacks Last-In First-Out (video)
- Will not implement. Implementing with array is trivial.
-
- Using Queues First-In First-Out(video)
- Queue (video)
- Circular buffer/FIFO
- Priority Queues (video)
- tail 포인터가 있는 연결 리스트를 사용하여 구현하기:
- enqueue(value) - tail이 가리키는 곳에 value를 추가한다
- dequeue() - value를 반환하고 가장 최근에 추가된 원소(front)를 제거한다.
- empty()
- 고정 길이 배열을 사용하여 구현하기:
- enqueue(value) - 사용 가능한 저장 공간의 끝에 item을 추가한다.
- dequeue() - value를 반환하고 가장 최근에 추가된 원소를 제거한다.
- empty()
- full()
- 비용:
- a bad implementation using linked list where you enqueue at head and dequeue at tail would be O(n) because you'd need the next to last element, causing a full traversal each dequeue
- enqueue: O(1) (amortized, linked list and array [probing])
- dequeue: O(1) (linked list and array)
- empty: O(1) (linked list and array)
-
-
동영상들:
-
온라인 강의들:
-
Linear probing을 사용하여 배열로 구현해보기
- hash(k, m) - m은 해시 테이블의 크기
- add(key, value) - 키가 이미 존재한다면, 값을 갱신한다.
- exists(key)
- get(key)
- remove(key)
-
More Knowledge
-
- Binary Search (video)
- Binary Search (video)
- 자세한 내용
- 구현:
- (정수가 정렬된 배열에서) 이진 탐색
- 재귀를 사용한 이진 탐색
-
- Bits cheat sheet - you should know many of the powers of 2 from (2^1 to 2^16 and 2^32)
- 비트 연산자(&, |, ^, ~, >>, <<) 제대로 이해하기
- 2의 보수와 1의 보수
- count set bits
- round to next power of 2:
- swap values:
- absolute value:
Trees
-
- Series: Core Trees (video)
- Series: Trees (video)
- 트리 기초 형태 만들기
- 순회
- 알고리즘 다루기
- BFS(너비-우선 탐색;breadth-first search) and DFS(깊이-우선 탐색;depth-first search)
- BFS 노트:
- level order (BFS, 큐를 사용하여)
- 시간 복잡도: O(n)
- 공간 복잡도: 최고: O(1) 최악: O(n/2)=O(n)
- DFS 노트:
- 시간 복잡도: O(n)
- 공간 복잡도: 최고: O(log n) - 평균적으로, 트리의 높이이다. 최악: O(n)
- 중위(inorder) (DFS: 왼쪽, 자신, 오른쪽)
- 후위(postorder) (DFS: 왼쪽, 오른쪽, 자신)
- 전위(preorder) (DFS: 자신, 왼쪽, 오른쪽)
- BFS 노트:
-
- Binary Search Tree Review (video)
- Series (video)
- starts with symbol table and goes through BST applications
- Introduction (video)
- MIT (video)
- C/C++:
- 이진 탐색 트리 - C/C++로 구현하기 (영상)
- BST 구현 - 스택과 힙에 메모리 할당 (영상)
- 이진 탐색 트리에서 가장 작은 원소와 가장 큰 원소 찾기 (영상)
- 이진 트리의 높이 구하기 (영상)
- 이진 트리 순회 - 너비-우선과 깊이-우선 전략 (영상)
- 이진 트리: Level Order Traversal (video)
- 이진 트리 순회: 전위, 중위, 후위 (영상)
- 이진 트리가 이진 탐색 트리인지 아닌 지 확인하기 (영상)
- 이진 탐색 트리에서 노드 삭제하기 (영상)
- Inorder Successor in a binary search tree (video)
- 구현:
- insert // 트리에 어떤 값을 삽입
- get_node_count // 저장된 값들의 개수 세기
- print_values // 트리 안의 값들을 최소부터 최대까지 출력
- delete_tree
- is_in_tree // 주어진 값이 트리 안에 있는 지를 반환
- get_height // 어떤 노드의 높이를 반환 (노드 하나의 높이는 1이다.)
- get_min // 트리에 저장된 값 중 가장 작은 값을 반환
- get_max // 트리에 저장된 값 중 가장 큰 값을 반환
- is_binary_search_tree
- delete_value
- get_successor // 값이 주어지면, 다음으로 가장 큰 값을, 없으면 -1을 반환
-
- 트리처럼 보여지지만, 보통은 선형으로 저장됩니다. (배열, 링크드리스트처럼)
- 힙(Heap)
- 소개 (영상)
- Naive한 구현들 (영상)
- 이진 트리 (영상)
- Tree Height Remark (video)
- 기본 연산들 (영상)
- 완전 이진 트리 (영상)
- 의사 코드(Pseudocode) (영상)
- 힙 정렬 - 시작하기 (영상)
- 힙 정렬 (영상)
- 힙 만들기 (영상)
- MIT: 힙과 힙 정렬 (영상)
- CS 61B Lecture 24: 우선순위 큐 (영상)
- 선형 시간에 힙 만들기 (max-heap)
- max-heap 구현하기:
- insert
- sift_up -
insert
하려면 필요 - get_max - 최대 원소를 반환하되, 삭제는 하지 않는다.
- get_size() - 저장된 원소들의 개수를 반환
- is_empty() - 힙에 원소를 하나도 없는 지 반환
- extract_max - 최대 원소를 반환하고, 그걸 삭제한다.
- sift_down -
extract_max
하려면 필요하다 - remove(x) - x번째 원소를 삭제
- heapify - 배열에 있는 원소들로 힙을 만든다.
heap_sort
하려면 필요 - heap_sort() - 정렬되지 않은 배열을 받아서 정렬된 배열로 만든다. 추가 메모리 없이 제자리에서 max-heap을 사용한다.
- 노트: min-heap을 사용하면 연산을 줄일 수 있지만, 공간이 두 배로 필요합니다. (제자리에서 못 하기 때문에)
Sorting
-
Notes:
- 정렬들 구현 & 각 정렬의 최적의 경우/최악의 경우, 평균적인 복잡도를 알기:
- 버블 소트 쓰지 마세요 - 끔찍하니까요 - n이 16이하 제외하고 O(n^2)
- 정렬 알고리즘들의 안정성 ("퀵소트는 안정적인가?")
- 어떤 알고리즘들에 연결 리스트를 쓸 수 있는가? 배열은? 둘 다는?
- 연결 리스트를 정렬하는 것은 추천하지 않지만, 병합 정렬은 가능합니다.
- 링크드 리스트로 병합 정렬
- 정렬들 구현 & 각 정렬의 최적의 경우/최악의 경우, 평균적인 복잡도를 알기:
-
힙소트의 경우, 위의 힙 데이터 구조를 보세요. 힙 정렬은 훌륭하지만 안정적이지 못합니다.
-
UC Berkeley:
-
병합 정렬 코드:
-
퀵 정렬 코드:
-
구현:
- 병합 정렬: 평균과 최악의 경우 O(n log n)
- 퀵 정렬: 평균적인 경우 O(n log n)
- 선택 정렬과 삽입 정렬은 둘 다 평균과 최악의 경우에 O(n^2)
- 힙 정렬의 경우, 위의 힙 데이터 구조를 보세요.
-
필요한 건 아니지만, 아래도 추천합니다:
개략적으로 보자면, 여기에 시각적으로 나타낸 15가지 정렬 알고리즘들을 보세요. 이 주제에 대해서 더 자세히 알고 싶다면, 몇몇 주제에 대한 세부사항에서 "정렬" 섹션를 보세요.
Graphs
그래프는 컴퓨터 과학의 여러 문제들을 표현하는 데 사용할 수 있다. 때문에 이 섹션은 트리나 정렬 섹션처럼 길다.
-
노트:
- 메모리에 그래프를 표시하는 세 가지 기본 방법이 있다:
- 오브젝트와 포인터
- 행렬
- 인접 리스트
- 각각의 표현과 장단점을 숙지하라.
- 넓이 우선 탐색(BFS)와 깊이 우선 탐색(DFS) - 계산상의 복잡성, 장단점, 실제 코드로 구현하는 방법을 알아야 한다.
- 질문을 받을 시 먼저 그래프 기반 솔루션을 찾고, 없을 경우에 다른 솔루션으로 넘어가라.
- 메모리에 그래프를 표시하는 세 가지 기본 방법이 있다:
-
MIT(영상):
- 너비 우선 탐색(BFS;Breadth-First Search)
- [깊이 우선 탐색(DFS;Depth-First Search)]((https://www.youtube.com/watch?v=AfSk24UTFS8&list=PLUl4u3cNGP61Oq3tWYp6V_F-5jb5L2iHb&index=14)
-
Skiena의 강좌 - 시작하기 아주 좋습니다:
- CSE373 2012 - Lecture 11 - Graph Data Structures (video)
- CSE373 2012 - Lecture 12 - Breadth-First Search (video)
- CSE373 2012 - Lecture 13 - Graph Algorithms (video)
- CSE373 2012 - Lecture 14 - Graph Algorithms (con't) (video)
- CSE373 2012 - Lecture 15 - Graph Algorithms (con't 2) (video)
- CSE373 2012 - Lecture 16 - Graph Algorithms (con't 3) (video)
-
그래프 (검토, 그 외 여러가지):
- 6.006 Single-Source Shortest Paths Problem (video)
- 6.006 Dijkstra (video)
- 6.006 Bellman-Ford (video)
- 6.006 Speeding Up Dijkstra (video)
- Aduni: Graph Algorithms I - Topological Sorting, Minimum Spanning Trees, Prim's Algorithm - Lecture 6 (video)
- Aduni: Graph Algorithms II - DFS, BFS, Kruskal's Algorithm, Union Find Data Structure - Lecture 7 (video)
- Aduni: Graph Algorithms III: Shortest Path - Lecture 8 (video)
- Aduni: Graph Alg. IV: Intro to geometric algorithms - Lecture 9 (video)
-
CS 61B 2014 (starting at 58:09) (video) - CS 61B 2014: Weighted graphs (video)
- Greedy Algorithms: Minimum Spanning Tree (video)
- Strongly Connected Components Kosaraju's Algorithm Graph Algorithm (video)
-
Full Coursera Course:
-
내가 구현할 것:
- DFS with 인접 리스트 (재귀)
- DFS with 인접 리스트 (스택을 쓴 비재귀)
- DFS with 인접 행렬 (재귀)
- DFS with 인접 행렬 (스택을 쓴 비재귀)
- BFS with 인접 리스트
- BFS with 인접 행렬
- 단일 출발지 최단 경로 (다익스트라)
- 최소 신장 트리 (MST;minimum spanning tree)
- DFS-기반 알고리즘들 (위의 Aduni 영상들을 보세요):
- 사이클 검사/확인 (위상 정렬할 때 필요합니다. 시작하기 전에 검사해야 하거든요.)
- 위상 정렬
- 그래프 내의 연결 요소(Connected Component)들 개수
- 강연결요소(SCC;Strongly Connected Component)들 나열하기
- 이분 그래프 확인하기
Skiena의 책(아래의 책 섹션 참조)과 인터뷰 책에서 더 많은 그래프 실습을 할 수 있습니다.
더 많은 지식
-
- 재귀와 백트래킹에 대한 스탠포드 대학 강의:
- 재귀는 언제 사용해야 하는 지
- 꼬리 재귀를 사용하는 게 그렇지 않은 것보다 얼마나 나은가요?
-
- 이 주제는 아주 어렵습니다. DP로 풀리는 각 문제마다 어떤 점화식을 정의해야 하는데 그게 까다롭습니다.
- 얽혀있는 패턴들을 확실히 이해할 때까지, 많은 DP 예시 문제들을 찾아보기를 권합니다.
- Videos:
- Skiena씨의 영상들은 따라가기 힘듭니다. 가끔 화이트보드를 사용하시는 데 너무 작아서 보기가 힘들거든요.
- Skiena: CSE373 2012 - Lecture 19 - 동적 프로그래밍 소개 (영상)
- Skiena: CSE373 2012 - Lecture 20 - Edit Distance (video)
- Skiena: CSE373 2012 - Lecture 21 - 동적 프로그래밍 예제들 (영상)
- Skiena: CSE373 2012 - Lecture 22 - 동적 프로그래밍의 활용 (영상)
- Simonson: Dynamic Programming 0 (59:18부터 시작) (영상)
- Simonson: Dynamic Programming I - Lecture 11 (영상)
- Simonson: Dynamic programming II - Lecture 12 (영상)
- List of individual DP problems (each is short): Dynamic Programming (video)
- Yale Lecture notes:
- Coursera:
-
- Optional: UML 2.0 Series (video)
- 객체 지향 소프트웨어 공학: UML과 JAVA를 사용한 소프트웨어 개발 (21개의 영상):
- Can skip this if you have a great grasp of OO and OO design practices.
- OOSE: Software Dev Using UML and Java
- SOLID OOP Principles:
- Bob Martin SOLID Principles of Object Oriented and Agile Design (video)
- SOLID Principles (video)
- S - Single Responsibility Principle | Single responsibility to each Object
- O - Open/Closed Principal | On production level Objects are ready for extension for not for modification
- L - Liskov Substitution Principal | Base Class and Derived class follow ‘IS A’ principal
- I - Interface segregation principle | clients should not be forced to implement interfaces they don't use
- D -Dependency Inversion principle | Reduce the dependency In composition of objects.
-
- Quick UML review (video)
- Learn these patterns:
- strategy
- singleton
- adapter
- prototype
- decorator
- visitor
- factory, abstract factory
- facade
- observer
- proxy
- delegate
- command
- state
- memento
- iterator
- composite
- flyweight
- Chapter 6 (Part 1) - Patterns (video)
- Chapter 6 (Part 2) - Abstraction-Occurrence, General Hierarchy, Player-Role, Singleton, Observer, Delegation (video)
- Chapter 6 (Part 3) - Adapter, Facade, Immutable, Read-Only Interface, Proxy (video)
- Series of videos (27 videos)
- Head First Design Patterns
- I know the canonical book is "Design Patterns: Elements of Reusable Object-Oriented Software", but Head First is great for beginners to OO.
- Handy reference: 101 Design Patterns & Tips for Developers
- Design patterns for humans
-
- Math Skills: How to find Factorial, Permutation and Combination (Choose) (video)
- Make School: Probability (video)
- Make School: More Probability and Markov Chains (video)
- Khan Academy:
- Course layout:
- Just the videos - 41 (each are simple and each are short):
-
- Know about the most famous classes of NP-complete problems, such as traveling salesman and the knapsack problem, and be able to recognize them when an interviewer asks you them in disguise.
- Know what NP-complete means.
- Computational Complexity (video)
- Simonson:
- Skiena:
- Complexity: P, NP, NP-completeness, Reductions (video)
- Complexity: Approximation Algorithms (video)
- Complexity: Fixed-Parameter Algorithms (video)
- Peter Norvig discusses near-optimal solutions to traveling salesman problem:
- Pages 1048 - 1140 in CLRS if you have it.
-
- Computer Science 162 - Operating Systems (25 videos):
- for processes and threads see videos 1-11
- Operating Systems and System Programming (video)
- What Is The Difference Between A Process And A Thread?
- Covers:
- Processes, Threads, Concurrency issues
- difference between processes and threads
- processes
- threads
- locks
- mutexes
- semaphores
- monitors
- how they work
- deadlock
- livelock
- CPU activity, interrupts, context switching
- Modern concurrency constructs with multicore processors
- Paging, segmentation and virtual memory (video)
- Interrupts (video)
- Scheduling (video)
- Process resource needs (memory: code, static storage, stack, heap, and also file descriptors, i/o)
- Thread resource needs (shares above (minus stack) with other threads in the same process but each has its own pc, stack counter, registers, and stack)
- Forking is really copy on write (read-only) until the new process writes to memory, then it does a full copy.
- Context switching
- How context switching is initiated by the operating system and underlying hardware
- Processes, Threads, Concurrency issues
- threads in C++ (series - 10 videos)
- concurrency in Python (videos):
- Computer Science 162 - Operating Systems (25 videos):
-
- Reading all from end to end with full comprehension will likely take more time than you have. I recommend being selective on papers and their sections.
- Love classic papers?
- 1978: Communicating Sequential Processes
- 2003: The Google File System
- replaced by Colossus in 2012
- 2004: MapReduce: Simplified Data Processing on Large Clusters
- mostly replaced by Cloud Dataflow?
- 2006: Bigtable: A Distributed Storage System for Structured Data
- 2006: The Chubby Lock Service for Loosely-Coupled Distributed Systems
- 2007: Dynamo: Amazon’s Highly Available Key-value Store
- The Dynamo paper kicked off the NoSQL revolution
- 2007: What Every Programmer Should Know About Memory (very long, and the author encourages skipping of some sections)
- 2010: Dapper, a Large-Scale Distributed Systems Tracing Infrastructure
- 2010: Dremel: Interactive Analysis of Web-Scale Datasets
- 2012: Google's Colossus
- paper not available
- 2012: AddressSanitizer: A Fast Address Sanity Checker:
- 2013: Spanner: Google’s Globally-Distributed Database:
- 2014: Machine Learning: The High-Interest Credit Card of Technical Debt
- 2015: Continuous Pipelines at Google
- 2015: High-Availability at Massive Scale: Building Google’s Data Infrastructure for Ads
- 2015: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
- 2015: How Developers Search for Code: A Case Study
- 2016: Borg, Omega, and Kubernetes
-
- 알아 두어야 할 것:
- 유닛 테스트는 어떻게 작동하는지
- mock object 는 무엇인지
- 통합 테스트는 무엇인지
- 의존성 주입은 무엇인지
- James Bach과 함께하는 애자일 소프트웨어 테스트 (비디오)
- 소프트웨어 테스트에 대한 James Bach의 무료 강의 (비디오)
- Steve Freeman - Test-Driven 개발 (이것은 우리가 의미하는 것은 아니다) (비디오)
- TDD는 끝났다. 오래 사는 테스팅.
- TDD는 정말 끝났는가? (비디오)
- 비디오 시리즈 (152 개) - 다 볼 필요 없음 (비디오)
- 파이턴과 함께하는 Test-Driven 웹 개발
- 의존성 주입:
- 테스트 어떻게 작성하는지
- 알아 두어야 할 것:
-
- 운영체제(OS)에서 어떻게 동작하는지
- 운영 체제 관련 영상들에서 알아보실 수 있습니다.
-
- 당신이 사용하는 프로그래밍 API들이 어떤 이점을 가져오는지 이해하기
- 그리고 그것들을 구현할 수 있는가?
-
- Sedgewick - Suffix Arrays (video)
- Sedgewick - Substring Search (videos)
- Search pattern in text (video)
이 주제를 더 자세히 알고 싶으시다면, 몇몇 주제에 대한 세부사항에서 "문자열 매칭" 섹션을 읽어보세요.
-
- 트라이에는 여러 종류가 있다는 것을 유의하라. 어떤 건 접두사가 있는 데, 어떤 건 그렇지 않고 또 어떤 것은 경로 추적을 위해 비트 대신에 문자열을 사용한다.
- 나는 코드만 읽었고, 구현은 안 했다.
- Sedgewick - Tries (3 videos)
- Notes on Data Structures and Programming Techniques
- Short course videos:
- The Trie: A Neglected Data Structure
- TopCoder - Using Tries
- Stanford Lecture (real world use case) (video)
- MIT, Advanced Data Structures, Strings (can get pretty obscure about halfway through)
-
- Big And Little Endian
- Big Endian Vs Little Endian (video)
- Big And Little Endian Inside/Out (video)
- Very technical talk for kernel devs. Don't worry if most is over your head.
- The first half is enough.
-
- 만약 당신이 네트워크에 대한 경험이 있거나 operations engineer 또는 믿음직한 엔지니어가 되고 싶다면 받을 수 있는 질문들
- 즉, 알면 좋은 것들이다.
- Khan Academy
- UDP and TCP: Comparison of Transport Protocols
- TCP/IP and the OSI Model Explained!
- Packet Transmission across the Internet. Networking & TCP/IP tutorial.
- HTTP
- SSL and HTTPS
- SSL/TLS
- HTTP 2.0
- Video Series (21 videos)
- Subnetting Demystified - Part 5 CIDR Notation
- 소켓:
System Design, Scalability, Data Handling
- 4년 이상의 경력자라면 이런 시스템 디자인 질문들을 받을 수 있다.
- Scalability and System Design are very large topics with many topics and resources, since there is a lot to consider when designing a software/hardware system that can scale. Expect to spend quite a bit of time on this.
- 고려사항:
- scalability
- Distill large data sets to single values
- Transform one data set to another
- Handling obscenely large amounts of data
- system design
- features sets
- interfaces
- class hierarchies
- designing a system under certain constraints
- simplicity and robustness
- tradeoffs
- performance analysis and optimization
- scalability
- 여기서 시작하세요: The System Design Primer
- System Design from HiredInTech
- How Do I Prepare To Answer Design Questions In A Technical Inverview?
- 8 Things You Need to Know Before a System Design Interview
- Algorithm design
- Database Normalization - 1NF, 2NF, 3NF and 4NF (video)
- System Design Interview - 여기에 리소스가 정말 많이 있습니다. 글과 예제들을 살펴보세요. 일부는 아래에도 적어놓았습니다.
- How to ace a systems design interview
- Numbers Everyone Should Know
- How long does it take to make a context switch?
- Transactions Across Datacenters (video)
- A plain English introduction to CAP Theorem
- Paxos Consensus algorithm:
- Consistent Hashing
- NoSQL Patterns
- Scalability:
- Great overview (video)
- Short series:
- Scalable Web Architecture and Distributed Systems
- Fallacies of Distributed Computing Explained
- Pragmatic Programming Techniques
- Jeff Dean - Building Software Systems At Google and Lessons Learned (video)
- Introduction to Architecting Systems for Scale
- Scaling mobile games to a global audience using App Engine and Cloud Datastore (video)
- How Google Does Planet-Scale Engineering for Planet-Scale Infra (video)
- The Importance of Algorithms
- Sharding
- Scale at Facebook (2009)
- Scale at Facebook (2012), "Building for a Billion Users" (video)
- Engineering for the Long Game - Astrid Atkinson Keynote(video)
- 7 Years Of YouTube Scalability Lessons In 30 Minutes
- How PayPal Scaled To Billions Of Transactions Daily Using Just 8VMs
- How to Remove Duplicates in Large Datasets
- A look inside Etsy's scale and engineering culture with Jon Cowie (video)
- What Led Amazon to its Own Microservices Architecture
- To Compress Or Not To Compress, That Was Uber's Question
- Asyncio Tarantool Queue, Get In The Queue
- When Should Approximate Query Processing Be Used?
- Google's Transition From Single Datacenter, To Failover, To A Native Multihomed Architecture
- Spanner
- Egnyte Architecture: Lessons Learned In Building And Scaling A Multi Petabyte Distributed System
- Machine Learning Driven Programming: A New Programming For A New World
- The Image Optimization Technology That Serves Millions Of Requests Per Day
- A Patreon Architecture Short
- Tinder: How Does One Of The Largest Recommendation Engines Decide Who You'll See Next?
- Design Of A Modern Cache
- Live Video Streaming At Facebook Scale
- A Beginner's Guide To Scaling To 11 Million+ Users On Amazon's AWS
- How Does The Use Of Docker Effect Latency?
- Does AMP Counter An Existential Threat To Google?
- A 360 Degree View Of The Entire Netflix Stack
- Latency Is Everywhere And It Costs You Sales - How To Crush It
- Serverless (very long, just need the gist)
- What Powers Instagram: Hundreds of Instances, Dozens of Technologies
- Cinchcast Architecture - Producing 1,500 Hours Of Audio Every Day
- Justin.Tv's Live Video Broadcasting Architecture
- Playfish's Social Gaming Architecture - 50 Million Monthly Users And Growing
- TripAdvisor Architecture - 40M Visitors, 200M Dynamic Page Views, 30TB Data
- PlentyOfFish Architecture
- Salesforce Architecture - How They Handle 1.3 Billion Transactions A Day
- ESPN's Architecture At Scale - Operating At 100,000 Duh Nuh Nuhs Per Second
- See "Messaging, Serialization, and Queueing Systems" way below for info on some of the technologies that can glue services together
- Twitter:
- For even more, see "Mining Massive Datasets" video series in the Video Series section.
- Practicing the system design process: Here are some ideas to try working through on paper, each with some documentation on how it was handled in the real world:
- review: The System Design Primer
- System Design from HiredInTech
- cheat sheet
- flow:
- Understand the problem and scope:
- define the use cases, with interviewer's help
- suggest additional features
- remove items that interviewer deems out of scope
- assume high availability is required, add as a use case
- Think about constraints:
- ask how many requests per month
- ask how many requests per second (they may volunteer it or make you do the math)
- estimate reads vs. writes percentage
- keep 80/20 rule in mind when estimating
- how much data written per second
- total storage required over 5 years
- how much data read per second
- Abstract design:
- layers (service, data, caching)
- infrastructure: load balancing, messaging
- rough overview of any key algorithm that drives the service
- consider bottlenecks and determine solutions
- Understand the problem and scope:
- Exercises:
Final Review
이 섹션에는 중요한 개념들을 빠르게 검토할 수 있는 짧은 영상들이 포함되어 있다.
복습을 하고자 한다면, 이 영상들이 도움이 될 것이다.
- 2-3분 분량의 주제별 짧은 영상 시리즈 (23 videos)
- 2-5분 분량의 주제별 짧은 영상 시리즈 - Michael Sambol (18 videos):
- Sedgewick Videos - Algorithms I
- Sedgewick Videos - Algorithms II
Coding Question Practice
이제 당신은 위의 컴퓨터 과학 주제들을 모두 알고 있으므로, 코딩 문제에 답하는 것을 연습할 차례이다.
코딩 문제 연습은 프로그래밍 문제에 대한 답을 외우는 것이 아니다.
당신에게 프로그래밍 문제를 푸는 연습이 필요한 이유:
- 문제 인식, 그리고 어떤 자료구조와 알고리즘이 언제 필요한지
- 문제의 조건을 모으기
- 인터뷰를 하듯 당신이 문제를 푸는 과정을 말하기
- 컴퓨터가 아닌 종이나 화이트보드에 코딩하기
- 당신의 풀이의 시간, 공간 복잡도를 제시하기
- 당신의 해답을 테스팅하기
체계적이고 소통하는 인터뷰에서의 문제풀이에 관한 좋은 시작점이 있다. 당신은 프로그래밍 인터뷰 책에서 이 서식을 얻을 수도 있지만, 나는 이 것이 가장 좋다고 본다: Algorithm design canvas
집에 화이트보드가 없는가? 그럴 수 있다. 나는 커다란 화이트보드를 가진 괴짜이다. 화이트보드 대신에 상점에서 큰 도화지를 사오자. 소파에 앉아서 연습할 수 있다. 이 것은 내 "소파 화이트보드"이다. 크기 비교를 위해 사진에 펜을 추가하였다. 펜을 쓰면, 곧 지우고 싶어질 것이다. 금방 지저분해 진다.
보충:
- Mathematics for Topcoders
- Dynamic Programming – From Novice to Advanced
- MIT Interview Materials
- Exercises for getting better at a given language
읽고 프로그래밍 문제 풀기 (순서대로):
- Programming Interviews Exposed: Secrets to Landing Your Next Job, 2nd Edition
- C, C++, Java로 답변
- Cracking the Coding Interview, 6th Edition
- Java로 답변
위의 도서 목록을 보세요.
Coding Question Practice
공부하는 게 머리에 잘 안 들어올 때, 한번 해보세요. 가능한 한 매일 코딩 챌린지를 하는겁니다.
코딩 인터뷰 질문들 영상:
Challenge sites:
- LeetCode
- TopCoder
- Project Euler (math-focused)
- Codewars
- HackerEarth
- HackerRank
- Codility
- InterviewCake
- Geeks for Geeks
- InterviewBit
- Sphere Online Judge (spoj)
- Codechef
Challenge repos:
모의 면접:
- Gainlo.co: Mock interviewers from big companies - I used this and it helped me relax for the phone screen and on-site interview.
- Pramp: Mock interviews from/with peers - peer-to-peer model of practice interviews
- Refdash: Mock interviews and expedited interviews - also help candidates fast track by skipping multiple interviews with tech companies.
- Cracking The Coding Interview Set 2 (videos):
- See Resume prep items in Cracking The Coding Interview and back of Programming Interviews Exposed
아래의 아이템들에 따른 너가 받을 20개의 인터뷰 질문에 대해 생각하라. 각각 2-3개의 대답을 준비해라. 당신이 성취한 것에 대해 데이터 뿐만 아니라 스토리를 만들어라.
- 왜 이 직업을 원합니까?
- 당신이 풀었던 문제 중 힘들었던 문제는?
- 큰 도전에 직면한 적은?
- 최고의/최악의 디자인을 본 적이 있는가?
- 현존하는 제품을 향상시킬 수 있는 아이디어
- 개인적으로 일할 때 가장 잘 일 하는가? 아니면 팀원으로서 있을 때?
- 어떤 기술과 경험들이 당신의 역할에서 자산이 되었으며 그 이유는?
- 어떤 것이 가장 즐거웠는가 [job x / project y]?
- 무엇이 가장 큰 도전이었는가 [job x / project y]?
- 무엇이 가장 힘들었던 버그였는가? [job x / project y]?
- 무엇을 배웠는가 [job x / project y]?
- 무엇이 향상되었는가 [job x / project y]?
내 경우에는 이랬다. (I already may know answer to but want their opinion or team perspective):
- 얼마나 큰 팀에 있었나요?
- 당신의 개발 사이클은 어떤 모습인가요? 폭포수(워터폴)/스프린트/애자일인가요?
- 보통 마감까지 달리시는 편인가요? 아니면 여유롭게 하시는 편인가요?
- 팀 내에서 의사 결정은 어떻게 하나요?
- 당신은 한 주에 미팅을 얼마나 한다고 생각하나요?
- 업무 환경이 집중력에 도움이 된다고 생각하나요?
- 지금은 어떤 일을 하고 계신가요?
- What do you like about it?
- 어떤 Work life를 생각하시나요?
축하드립니다!
꾸준히 공부하시길 바랍니다.
끝난게 아니니까요.
*****************************************************************************************************
*****************************************************************************************************
아래의 모든 것들은 선택 사항이다.
당신은 이것들을 공부함으로써 더 많은 CS 개념들에 대해 알 수 있을 것이며, 소프트웨어 엔지니어링 직업을 준비하는 데에도 도움이 될 것
이다. 더불어 당신은 훨씬 더 균형 잡힌 소프트웨어 엔지니어가 될 것이다.
*****************************************************************************************************
*****************************************************************************************************
Additional Books
- The Unix Programming Environment
- an oldie but a goodie
- The Linux Command Line: A Complete Introduction
- a modern option
- TCP/IP Illustrated Series
- Head First Design Patterns
- a gentle introduction to design patterns
- Design Patterns: Elements of Reusable Object-Oriented Software
- aka the "Gang Of Four" book, or GOF
- the canonical design patterns book
- UNIX and Linux System Administration Handbook, 5th Edition
Additional Learning
These topics will likely not come up in an interview, but I added them to help you become a well-rounded software engineer, and to be aware of certain technologies and algorithms, so you'll have a bigger toolbox.
-
- Familiarize yourself with a unix-based code editor
- vi(m):
- emacs:
-
- Khan Academy
- more about Markov processes:
- See more in MIT 6.050J Information and Entropy series below.
-
- Intro
- Parity
- Hamming Code:
- Error Checking
-
- also see videos below
- make sure to watch information theory videos first
- Information Theory, Claude Shannon, Entropy, Redundancy, Data Compression & Bits (video)
-
- also see videos below
- make sure to watch information theory videos first
- Khan Academy Series
- Cryptography: Hash Functions
- Cryptography: Encryption
-
- make sure to watch information theory videos first
- Computerphile (videos):
- Compressor Head videos
- (optional) Google Developers Live: GZIP is not enough!
-
- Given a Bloom filter with m bits and k hashing functions, both insertion and membership testing are O(k)
- Bloom Filters
- Bloom Filters | Mining of Massive Datasets | Stanford University
- Tutorial
- How To Write A Bloom Filter App
-
- used to determine the similarity of documents
- the opposite of MD5 or SHA which are used to determine if 2 documents/strings are exactly the same.
- Simhashing (hopefully) made simple
-
-
Know at least one type of balanced binary tree (and know how it's implemented):
-
"Among balanced search trees, AVL and 2/3 trees are now passé, and red-black trees seem to be more popular. A particularly interesting self-organizing data structure is the splay tree, which uses rotations to move any accessed key to the root." - Skiena
-
Of these, I chose to implement a splay tree. From what I've read, you won't implement a balanced search tree in your interview. But I wanted exposure to coding one up and let's face it, splay trees are the bee's knees. I did read a lot of red-black tree code.
- splay tree: insert, search, delete functions If you end up implementing red/black tree try just these:
- search and insertion functions, skipping delete
-
I want to learn more about B-Tree since it's used so widely with very large data sets.
-
AVL trees
- In practice: From what I can tell, these aren't used much in practice, but I could see where they would be: The AVL tree is another structure supporting O(log n) search, insertion, and removal. It is more rigidly balanced than red–black trees, leading to slower insertion and removal but faster retrieval. This makes it attractive for data structures that may be built once and loaded without reconstruction, such as language dictionaries (or program dictionaries, such as the opcodes of an assembler or interpreter).
- MIT AVL Trees / AVL Sort (video)
- AVL Trees (video)
- AVL Tree Implementation (video)
- Split And Merge
-
Splay trees
- In practice: Splay trees are typically used in the implementation of caches, memory allocators, routers, garbage collectors, data compression, ropes (replacement of string used for long text strings), in Windows NT (in the virtual memory, networking and file system code) etc.
- CS 61B: Splay Trees (video)
- MIT Lecture: Splay Trees:
- Gets very mathy, but watch the last 10 minutes for sure.
- Video
-
Red/black trees
- these are a translation of a 2-3 tree (see below)
- In practice: Red–black trees offer worst-case guarantees for insertion time, deletion time, and search time. Not only does this make them valuable in time-sensitive applications such as real-time applications, but it makes them valuable building blocks in other data structures which provide worst-case guarantees; for example, many data structures used in computational geometry can be based on red–black trees, and the Completely Fair Scheduler used in current Linux kernels uses red–black trees. In the version 8 of Java, the Collection HashMap has been modified such that instead of using a LinkedList to store identical elements with poor hashcodes, a Red-Black tree is used.
- Aduni - Algorithms - Lecture 4 (link jumps to starting point) (video)
- Aduni - Algorithms - Lecture 5 (video)
- Red-Black Tree
- An Introduction To Binary Search And Red Black Tree
-
2-3 search trees
- In practice: 2-3 trees have faster inserts at the expense of slower searches (since height is more compared to AVL trees).
- You would use 2-3 tree very rarely because its implementation involves different types of nodes. Instead, people use Red Black trees.
- 23-Tree Intuition and Definition (video)
- Binary View of 23-Tree
- 2-3 Trees (student recitation) (video)
-
2-3-4 Trees (aka 2-4 trees)
- In practice: For every 2-4 tree, there are corresponding red–black trees with data elements in the same order. The insertion and deletion operations on 2-4 trees are also equivalent to color-flipping and rotations in red–black trees. This makes 2-4 trees an important tool for understanding the logic behind red–black trees, and this is why many introductory algorithm texts introduce 2-4 trees just before red–black trees, even though 2-4 trees are not often used in practice.
- CS 61B Lecture 26: Balanced Search Trees (video)
- Bottom Up 234-Trees (video)
- Top Down 234-Trees (video)
-
N-ary (K-ary, M-ary) trees
- note: the N or K is the branching factor (max branches)
- binary trees are a 2-ary tree, with branching factor = 2
- 2-3 trees are 3-ary
- K-Ary Tree
-
B-Trees
- fun fact: it's a mystery, but the B could stand for Boeing, Balanced, or Bayer (co-inventor)
- In Practice: B-Trees are widely used in databases. Most modern filesystems use B-trees (or Variants). In addition to its use in databases, the B-tree is also used in filesystems to allow quick random access to an arbitrary block in a particular file. The basic problem is turning the file block i address into a disk block (or perhaps to a cylinder-head-sector) address.
- B-Tree
- Introduction to B-Trees (video)
- B-Tree Definition and Insertion (video)
- B-Tree Deletion (video)
- MIT 6.851 - Memory Hierarchy Models (video) - covers cache-oblivious B-Trees, very interesting data structures - the first 37 minutes are very technical, may be skipped (B is block size, cache line size)
-
-
- great for finding number of points in a rectangle or higher dimension object
- a good fit for k-nearest neighbors
- Kd Trees (video)
- kNN K-d tree algorithm (video)
-
- "These are somewhat of a cult data structure" - Skiena
- Randomization: Skip Lists (video)
- For animations and a little more detail
-
- Combination of a binary search tree and a heap
- Treap
- Data Structures: Treaps explained (video)
- Applications in set operations
-
- 아래에 있는 영상을 확인하세요.
-
- Why ML?
- Google's Cloud Machine learning tools (video)
- Google Developers' Machine Learning Recipes (Scikit Learn & Tensorflow) (video)
- Tensorflow (video)
- Tensorflow Tutorials
- Practical Guide to implementing Neural Networks in Python (using Theano)
- Courses:
- Great starter course: Machine Learning - videos only - see videos 12-18 for a review of linear algebra (14 and 15 are duplicates)
- Neural Networks for Machine Learning
- Google's Deep Learning Nanodegree
- Google/Kaggle Machine Learning Engineer Nanodegree
- Self-Driving Car Engineer Nanodegree
- Metis Online Course ($99 for 2 months)
- Resources:
Additional Detail on Some Subjects
I added these to reinforce some ideas already presented above, but didn't want to include them
above because it's just too much. It's easy to overdo it on a subject.
You want to get hired in this century, right?
-
Union-Find
-
More Dynamic Programming (videos)
- 6.006: Dynamic Programming I: Fibonacci, Shortest Paths
- 6.006: Dynamic Programming II: Text Justification, Blackjack
- 6.006: DP III: Parenthesization, Edit Distance, Knapsack
- 6.006: DP IV: Guitar Fingering, Tetris, Super Mario Bros.
- 6.046: Dynamic Programming & Advanced DP
- 6.046: Dynamic Programming: All-Pairs Shortest Paths
- 6.046: Dynamic Programming (student recitation)
-
Advanced Graph Processing (videos)
-
MIT Probability (mathy, and go slowly, which is good for mathy things) (videos):
-
**문자열 매칭
- 라빈-카프(Rabin-Karp) (동영상):
- Knuth-Morris-Pratt (KMP):
- 보이어-무어(Boyer–Moore) 문자열 검색 알고리즘
- Coursera: Algorithms on Strings
- starts off great, but by the time it gets past KMP it gets more complicated than it needs to be
- 트라이(tries)에 대해서 잘 설명하고 있다.
- 이건 생략 가능
-
정렬
- 스탠포드 대학의 정렬 강의들:
- Shai Simonson, Aduni.org:
- Steven Skiena lectures on sorting:
편하게 보세요. "Netflix and skill"이라니까요 :P
비디오 시리즈
-
List of individual Dynamic Programming problems (each is short)
-
Excellent - MIT Calculus Revisited: Single Variable Calculus
-
Computer Science 70, 001 - Spring 2015 - Discrete Mathematics and Probability Theory
-
CSE373 - Analysis of Algorithms (25 videos)
-
UC Berkeley CS 152: Computer Architecture and Engineering (20 videos) -
Carnegie Mellon - Computer Architecture Lectures (39 videos)
-
MIT 6.042J: Mathematics for Computer Science, Fall 2010 (25 videos)
-
MIT 6.050J: Information and Entropy, Spring 2008 (19 videos)