용산 아이파크몰 지브리샾 기타

촬영 금지라서 사진은 포토존에서 찍은 이걸로 마무리.

워낙에 깜찍한 아이템들이 많아서 참기 힘들었지만 가격 끔찍 ㅠ.ㅠ



Jupyter 에서 %who , %who_ls , %whos 차이점 NoSQL/Big Data/DB

말이 필요 없다. 결과로 보는게 확실하다.


친구, 나를 맞혀봐 기타


고지혈증 ? 우습게 넘기지 마세요 !!! 기타

아마 성인 남성이라면 대부분 건강 검진때 들어봤을만한 단어이다.

쉽게 말해 피 속에 나쁜 기름기(콜레스테롤?)가 많다는거다. 이게 혈관을 막고, ...

의사가 아닌 관계로 자세한건 패스하고.. 어쨌거나 건강에 좋지 않은건데...

지난 연말 건강검진 결과로 외래 진료를 가보니 충격 그 자체 ㅠ.ㅠ

심장CT 결과에서 단순 고지혈증 단계를 넘어서 그냥 넘어가면 안되고 약을 먹어야 한다는.

지난 여름 수차례 심장에 뭔가 이상이 있는 듯한 전조 증상(갑자기 가슴이 답답)이 있기에, 

건강 검진에 심장CT를 옵션으로 넣은거였다.

의사 쌤이 심장CT 아주 적절한 시기에 잘 받아서 초기에 발견된거라며 그냥 지나쳤으면 심근경색, 

뇌에 생기면 뇌졸증, ... 그러면 그 다음은 뭔지 말안해도 다들 알거다. 끔찍하다.

다행히 약 먹으면 좋아질거라며 고지혈증 약을 3개월 처방 받았다. 이후에도 계속 관찰 필요.

이 글을 보는 여러분도 건강 검진 잘 챙겨 받고 이상 징후가 있으면 병원에 꼭 가보길 권한다.


[데이터 전처리 대전] 도서 리뷰 기타

최근에 상황이 가능해서 오프라인 교육을 몇 가지 수강했다.

R을 이용한 데이터 분석, 파이썬을 이용한 데이터 분석, 텐서플로우를 이용한 딥 러닝, ...

예전에 실무에서도 많이 느꼈고 새삼스레 이런 교육들을 듣다 보니(실습이나 예제를 하려면 필수)

데이터 전처리 작업이 대부분의 경우에 필요하고 의외로 이 부분이 엄청난 시간과 리소스를 필요로 한다.

교육 도중에도 어느 수강생이 '데이터 전처리'  에 대해서 레퍼런스를 알려달라 했더니, 

강사가 구글 검색해서 자신에게 맞는 책을 보라고 했던 기억도 난다.



개인적으로 아주 시기 적절하게  이 책이 나와 보게 되었는데 일단 먼저 후한 점수를 주고 싶다.

그 이유는 이 책의 쿡북 형태(특정 문제나 주제를 어떻게 해결할지 서술)를 띠고 있으며,

데이터 처리에 요즘 가장 많이 사용하는 R, SQL, 파이썬 3가지 언어로 설명을 하고 있기 때문이다.


책의 분량은 360 페이지 정도로 부담 없는 사이즈 이지만 내용은 약간 고급 내용도 다루고 있다.

목차를 보면 처음에는 단순하게 최빈값, 순위 계산, 데이터 조인 등을 다루다가 

뒤로 갈수록 데이터 분석 모델이나 머신 러닝 관련 내용들이 나온다. 


아마 원저자는(일본 사람이다) 단순한 데이터 전처리가 아니라 머신 러닝을 위한 데이터 전처리를 책에 담고 싶었나보다. 

책에 나오는 예제를 실습하기 위해서는 아마존 레드쉬프트, R, 파이썬을 설치해야 한다. 

부록에서 설명은 되어 있지만 R, 파이썬 설치는 너무 쉬워서 문제가 없을텐데 

MySQL이나 PostgreSQL 등의 접하기 쉬운 DB가 아닌  생뚱 맞게 DB를 아마존 레드쉬프트를 사용하는 것은 옥의 티?

R, SQL, 파이썬 3가지 언어로 설명하고 있고, 책의 뒤편으로 갈수록 고급 내용이나 머신 러닝 등의 내용이 나온다고 했는데 

아래 사진을 보면 SQL 설명이 없는 내용들이 꽤 나온다. 


이건 저자가 일부러 설명을 안하는게 아니라 대부분의 머신 러닝 알고리즘은

SQL 로 구현이 불가능하거나 아주 어렵기 때문에 실무에서도 대부분 다른 언어로 대체하기 때문이다.

결론!  데이터 전처리만 하더라도 다양한 방법/언어/라이브러리가 있으므로

엄청난 분량이 나올 수 있지만 이 책은 3가지 언어로 핵심만 설명하고 있다. 

이 책에 나오는 내용들은 전반적인 큰 숲을 둘러보는 용도로 사용하고, 

실무 프로젝트에서의 디테일한 부분은 각각의 언어나 라이브러리를 이용하여 각개격파 하는 방식으로 접근하길 추천한다.


1 2 3 4 5 6 7 8 9 10 다음

Google Analytics