1년 안에 빅데이터 전문가 되는 법
Publish date: 2020-07-12Tags: 데이터-분석
Table of contents
참고 링크
- http://dagyeom.net/ : 저자의 회사
책에 나온 추천 자료
- 빅데이터 비지니스 (p128-129)
- 데이터 마이닝(p134)
- 자격증 교재(p140)
- 데이터 분석 코딩(p150)
- 수리 통계학
- 딥러닝
- DB
- 추천 알고리즘
- Infra (p244)
- Python 어플리케이션 개발 (p245)
인상 깊은 단락
p39
서울대학교 컴퓨터 공학부 정원이 55명인데 반해 스탠퍼드는 739명
p106
심지어 파이썬을 써도 분석 환경으로 주피터 노트북, 주피터 랩, 스파이더, 파이참, 스파이더 중에 무엇을 쓰는 게 좋은지 물어보는 사람도 있다. 그냥 자신이 편한 것을 쓰면 된다. 아무거나 써도 내가 편하고 잘하면 아무런 문제가 없다.
자신이 쓰는 도구의 장단점을 알고 써야 더 발전이 있지 않을까하는 생각이 들었다.
p146
R과 Python에서 명시적인 데이텨형 선언이 필요 없음을 언급
p150 ~ p151
도표9에 자바 vs 파이썬으로 파일 읽기 코드 비교.
Java에서 FileInputStream과 BufferedReader를 쓴 코드를 보여주면서 Java 코드가 파이썬에 비해 길다고 설명한다. 그러나 Java11에 들어간 Files.readString()
을 쓰면 Python과 비슷한 추상화 수준으로 간단히 할 수 있다.
String content = Files.readString(Path.of("/path/test.txt"));
System.out.println(content);
파일 내용을 메모리에 다 안 올리려면 JDK9 이상에서 아래와 같이 할수도 있다.
var input = new FileInputStream("/path/test.txt");
input.transferTo(System.out);
input.close();
이런 예제보다 파이썬에서 간결하게 쓸 수 있는 문법 비교가 더 나았을 듯하다.
p206
프로그래밍 언어 순위에서 ‘스파크'가 순위 밖임을 언급. Apache Spark는 프레임워크이기 때문에 언어 순위에서 찾는 것이 분류에 맞지 않다고 느껴진다. 이 책에서는 전반적으로 Spark를 R, Python과 동등한 레벨의 언어처럼 언급하고 있다.
p249
그리고 수능 시험 며칠 전 신종플루에 걸려 원하는 시험 점수를 얻지 못했을 때에는 인생이 꼬인 것처럼 느껴졌다.
‘우리는 차별에 찬성합니다'의 125쪽에 있는 수능 성적과 불안감에 대한 내용이 떠올랐다.
p252
이들이 한 달 동안 영혼을 팔아서 번 돈은 200~400만원 남짓이다. 그 돈에 당신의 영혼을 팔아서는 안 된다. 당신보다 더 가치 있고 소중한 것은 없다. 결코 현대판 노예로 살아서는 안 된다. 푼돈과 현재의 시간을 맞바꾸지 마라.
200~400만원은 푼돈이라고 읽힐 수도 있다. 그 돈도 절실한 사람들이 많다. 돈의 액수과 상관없이, 당장의 수입에 연연하지 말고 미래를 위한 투자를 해라는 정도의 내용이라면 더 무난했을 것이다.
p255
재택근무 예찬
만약 당신이 회사원인데 회사 의자가 불편하다고 의자를 바꾸고 책상이 좁다고 큰 책상을 바꿀 수 있는가? 모니터가 작다고 큰 모니터로 바꾸고 컴퓨터도 더 좋은 컴퓨터로 바꿀 수 있는가? 불가능하다. 회사에서 당신만을 위한 특권을 주지 않을 것이다.
모니터나 컴퓨터 정도는 예산 내에서는 바꿔주는 회사가 요즘에 많다.
comments powered by Disqus