1년 안에 빅데이터 전문가 되는 법

Publish date: 2020-07-12
Tags: 데이터-분석

참고 링크

책에 나온 추천 자료

인상 깊은 단락

p39

서울대학교 컴퓨터 공학부 정원이 55명인데 반해 스탠퍼드는 739명

p106

심지어 파이썬을 써도 분석 환경으로 주피터 노트북, 주피터 랩, 스파이더, 파이참, 스파이더 중에 무엇을 쓰는 게 좋은지 물어보는 사람도 있다. 그냥 자신이 편한 것을 쓰면 된다. 아무거나 써도 내가 편하고 잘하면 아무런 문제가 없다.

자신이 쓰는 도구의 장단점을 알고 써야 더 발전이 있지 않을까하는 생각이 들었다.

p146

R과 Python에서 명시적인 데이텨형 선언이 필요 없음을 언급

p150 ~ p151

도표9에 자바 vs 파이썬으로 파일 읽기 코드 비교.

Java에서 FileInputStream과 BufferedReader를 쓴 코드를 보여주면서 Java 코드가 파이썬에 비해 길다고 설명한다. 그러나 Java11에 들어간 Files.readString() 을 쓰면 Python과 비슷한 추상화 수준으로 간단히 할 수 있다.

String content = Files.readString(Path.of("/path/test.txt"));
System.out.println(content);

파일 내용을 메모리에 다 안 올리려면 JDK9 이상에서 아래와 같이 할수도 있다.

var input = new FileInputStream("/path/test.txt");
input.transferTo(System.out);
input.close();

이런 예제보다 파이썬에서 간결하게 쓸 수 있는 문법 비교가 더 나았을 듯하다.

p206

프로그래밍 언어 순위에서 ‘스파크'가 순위 밖임을 언급. Apache Spark는 프레임워크이기 때문에 언어 순위에서 찾는 것이 분류에 맞지 않다고 느껴진다. 이 책에서는 전반적으로 Spark를 R, Python과 동등한 레벨의 언어처럼 언급하고 있다.

p249

그리고 수능 시험 며칠 전 신종플루에 걸려 원하는 시험 점수를 얻지 못했을 때에는 인생이 꼬인 것처럼 느껴졌다.

‘우리는 차별에 찬성합니다'의 125쪽에 있는 수능 성적과 불안감에 대한 내용이 떠올랐다.

p252

이들이 한 달 동안 영혼을 팔아서 번 돈은 200~400만원 남짓이다. 그 돈에 당신의 영혼을 팔아서는 안 된다. 당신보다 더 가치 있고 소중한 것은 없다. 결코 현대판 노예로 살아서는 안 된다. 푼돈과 현재의 시간을 맞바꾸지 마라.

200~400만원은 푼돈이라고 읽힐 수도 있다. 그 돈도 절실한 사람들이 많다. 돈의 액수과 상관없이, 당장의 수입에 연연하지 말고 미래를 위한 투자를 해라는 정도의 내용이라면 더 무난했을 것이다.

p255

재택근무 예찬

만약 당신이 회사원인데 회사 의자가 불편하다고 의자를 바꾸고 책상이 좁다고 큰 책상을 바꿀 수 있는가? 모니터가 작다고 큰 모니터로 바꾸고 컴퓨터도 더 좋은 컴퓨터로 바꿀 수 있는가? 불가능하다. 회사에서 당신만을 위한 특권을 주지 않을 것이다.

모니터나 컴퓨터 정도는 예산 내에서는 바꿔주는 회사가 요즘에 많다.

comments powered by Disqus