(한빛미디어에서 모집하는 혼공학습단 활동의 일환으로 혼자 공부하는 머신러닝+딥러닝 책을 공부하고 작성한 글입니다. 책은 제 돈으로 샀습니다. 본문의 코드는 책의 소스코드를 기반으로 하되 글 흐름에 맞게 수정한 것입니다. 원본 코드는 저자 박해선 님의 깃허브에서 보실 수 있습니다. 책에 나오는 넘파이, 판다스 등의 내용은 본 글에는 자세히 넣지 않았습니다. 본 글의 코드는 제 깃허브에서 보실 수 있습니다.) 5장은 지금까지와 다르게 참 많은 내용이 나옵니다. 대부분은 공식 문서에 굉장히 잘 설명되어 있습니다. 아래는 본 글을 쓰면서 참고한 공식 문서들입니다. sklearn.tree.DecisionTreeClassifier sklearn.tree.plot_tree Decision Trees Cross-val..
(한빛미디어에서 모집하는 혼공학습단 활동의 일환으로 혼자 공부하는 머신러닝+딥러닝 책을 공부하고 작성한 글입니다. 책은 제 돈으로 샀습니다. 본문의 코드는 책의 소스코드를 기반으로 하되 글 흐름에 맞게 수정한 것입니다. 원본 코드는 저자 박해선 님의 깃허브에서 보실 수 있습니다. 책에 나오는 넘파이, 판다스 등의 내용은 본 글에는 자세히 넣지 않았습니다. 본 글의 코드는 제 깃허브에서 보실 수 있습니다.) 목차 1. 분류의 정확도 2. 로지스틱 회귀 - 이진 분류 3. 로지스틱 회귀 - 다중 분류 4. 확률적 경사 하강법: 분류 모델의 계수를 찾는 방법 5. 손실 함수: 분류 모델의 목적 함수 6. 확률적 경사 하강법 실습 7. 에포크와 과대/과소적합 8. 기본 미션: 04-1 확인 문제 2번 풀이과정 ..
(한빛미디어에서 모집하는 혼공학습단 활동의 일환으로 혼자 공부하는 머신러닝+딥러닝 책을 공부하고 작성한 글입니다. 책은 제 돈으로 샀습니다. 본문의 코드는 책의 소스코드를 기반으로 하되 글 흐름에 맞게 수정한 것입니다. 원본 코드는 저자 박해선 님의 깃허브에서 보실 수 있습니다. 책에 나오는 넘파이, 판다스 등의 내용은 본 글에는 자세히 넣지 않았습니다. 본 글의 코드는 제 깃허브에서 보실 수 있습니다.) 회귀回歸? 지난 1-2장에서는 길이와 무게로부터 샘플을 분류하는 방법을 배웠습니다. 즉, 주어진 특성feature값으로부터 샘플이 어느 클래스class에 속하는지를 찾아내는 방법이었죠. 그래서 사이킷런의 KNeighborsClassifier를 사용했습니다. 특성은 생선의 길이와 무게였고, 이로부터 생선..
(한빛미디어에서 모집하는 혼공학습단 활동의 일환으로 혼자 공부하는 머신러닝+딥러닝 책을 공부하고 작성한 글입니다. 책은 제 돈으로 샀습니다. 본문의 코드는 책의 소스코드를 기반으로 하되 글 흐름에 맞게 수정한 것입니다. 원본 코드는 저자 박해선 님의 깃허브에서 보실 수 있습니다. 책에 나오는 넘파이, 판다스 등의 내용은 본 글에는 넣지 않았습니다.) 수상한 100점 1장에서 생선 데이터(fish_data)와 정답(fish_target)을 이용해서 K-NN을 훈련시켰습니다. 그리고 동일한 데이터로 평가까지 진행했습니다. 스코어가 1.0이 나와서 행복했었죠. 그런데 조금만 생각해보면 이상하다는 걸 알 수 있습니다. 훈련과 평가를 같은 데이터로 해도 될까요? 외계인에게 사진만 보고 개인지 고양이인지 맞추게 하..
(한빛미디어에서 모집하는 혼공학습단 활동의 일환으로 혼자 공부하는 머신러닝+딥러닝 책을 공부하고 작성한 글입니다. 책은 제 돈으로 샀습니다. 본문의 코드는 책의 소스코드를 기반으로 하되 글 흐름에 맞게 수정한 것입니다. 원본 코드는 저자 박해선 님의 깃허브에서 보실 수 있습니다. 책에 나오는 넘파이, 판다스 등의 내용은 본 글에는 넣지 않았습니다.) 머신러닝은 어떻게 시작되었나? 머신러닝에서 가장 유명한 문제는 아마 고양이와 개를 구별하는 문제일 것입니다. 사람은 태어나서 고작(?) 몇 년의 훈련만 거치면 사진을 보고 개인지 고양이인지 알 수 있습니다. 실제로 몇 년이 걸리는지 언급한 기사나 연구가 있는지 찾아봤는데 안타깝게도 잘 찾아지지 않네요. 저만 궁금한가 봅니다. 정확히 정의된 작업을 처리하는 속..
한빛미디어에서 주최하는 혼공학습단에 선정되어 7월 4일부터 활동을 시작합니다. (모집안내 링크) 책을 하나 골라서 공부한 내용을 블로그에 올리는 것인데, 자바스크립트, C언어, R 데분 등 다양한 주제가 있었지만 저는 과감하게(?) 머신러닝+딥러닝을 골랐습니다. 사실 미션은 어렵지 않습니다. 이 정도 미션도 수행하지 않았다면 그냥 공부를 안 했다고 봐도 무방할 정도인 것 같군요. (말넘심?) 얼마 전 박조은(유튜브 채널 오늘코드) 님의 발표를 듣고 적잖은 충격을 받았습니다. 발표를 한 마디로 요약하면 이렇습니다. DONE IS BETTER THAN PERFECT. 완벽하게 하려고 하지 말고 일단 뭐라도 해라. 자괴감, 한심스러움, 계획만 무성하고 실천에 옮기지 않는 자신에 대한 자책감... 반성하는 마음..