본문 바로가기

분류 전체보기92

머신러닝 - Naive Bayes Classifier(분류) 정리 이번 포스팅에선 Naive Bayes, 나이브 베이즈 분류의 이론적인 면에 대해서 정리해보고자 한다. 참고한 자료는 수업시간에 배운 내용인데, 출처는 아래 책이다. https://www.wiley.com/en-br/Data+Mining+for+Business+Analytics:+Concepts,+Techniques+and+Applications+in+Python-p-9781119549840 코드와 이미지 또한 출처가 명시되어 있지 않다면 책에서 제공하는 파이썬 코드를 사용했음을 명시한다. Bayes 확률론 베이즈 정리는 고등학교 수학 시간에 조건부 확률을 배우면서 등장하는 이론이다. 수학자 베이즈가 정리한 이론이어서 이러한 이름이 붙었다. 워낙 유명해서 자세한 설명은 건너뛰고, Posterior 와 Pr.. 2023. 6. 17.
머신러닝 - Regularization 과 LASSO, Ridge 정리 이번 포스팅에선 모델선택의 방법 중 하나인 Shrinkage methods 가 사용하는 Regularization (규제화, 벌점화) 와 이를 이용한 LASSO, Ridge Regression에 대해 정리해보려고 한다. 참고한 자료는 수업시간에 사용한 교재 ISLR2와 이를 기반으로 한 유튜브 영상이다. https://www.youtube.com/watch?v=lLlG5xkyqIA&list=PLoROMvodv4rOzrYsAxzQyHb8n_RWNuS1e&index=39&ab_channel=StanfordOnline https://www.statlearning.com/resources-second-edition Resources - Second Edition — An Introduction to Statis.. 2023. 6. 9.
파이썬 오류 기록 - LGBM, Python, Dask 관련 AttributeError 오랜만에 주피터 노트북에서 lgbm 모델을 사용하려고 했는데 아래와 같은 오류를 확인했다. import pandas as pd import lightgbm as lgb AttributeError: module 'pandas.core.strings' has no attribute 'StringMethods' lightgbm (경황이 없어서 캡쳐를 하지 못 했다.) 오류가 난 부분은 lightgbm 을 import 하는 코드였다. 어째서 이런 오류가 났는지 ChatGPT에 우선 물어봤는데, pandas의 버전이 compatible하지 않는다고 lightgbm을 update하라는 답변이 돌아왔다. 하지만 pip 로 update를 한 결과 이미 최신버전이었고, pandas도 마찬가지로 최신이어서 더 할 것이 없.. 2023. 6. 4.
머신러닝 - Bootstrap 정리 with 중심극한정리, R 머신러닝에 대한 포스팅을 거의 하지 않았으나 공부는 꾸준히 하고 있었는데 (학교에서), 최근에 Bagging 과 Boosting에 대해서 배우고 있다. 그런데 이 부분에서도 Resampling 에 대해 배울 때 배웠던 Bootstrap 기법이 꽤 중요한 개념으로 작용하고 있다는 것을 알게 되었다. 그래서 Bootstrap 부터 시작해서, Tree 모형들 더 나아가 Random Forest 와 Bagging, 그리고 Boosting에 대해 쭉 정리해보고자 한다. 이번 포스팅에선 Bootstrap 기법에 대해 정리해보도록 하겠다. 포스팅하면서 참고한 자료는 다음과 같다. https://www.youtube.com/playlist?list=PLoROMvodv4rOzrYsAxzQyHb8n_RWNuS1e http.. 2023. 5. 31.
R - Rmarkdown 사용해서 문서 만들기 (2) 오늘은 Rmarkdown 으로 표, 그림 등 여러 자료들, 기능들을 어떻게 첨부할 수 있을지 정리해보도록 하겠다. HTML, CSS 적용 Rmarkdown 에선 일반적인 markdown과는 달리, 그냥 html 코드를 쳐도 알아서 시행이 된다고 한다. 사실 html과 css에 대해선 아는 바가 거의 없기 때문에, 예제를 통해 이런 것도 있구나 하고 넘어가려고 한다. 위와 같은 html 코드를 Rmarkdown에 입력한다. 이는 CSS 의 스타일을 정해놓은 html 코드이다. # My HTML and CSS Example This is a header with custom CSS styling. This paragraph has custom CSS styling as well. 그리고 위와 같은 코드를 입.. 2023. 5. 30.
R - Rmarkdown 사용해서 문서 만들기 (1) 오늘은 RStudio 를 이용해서 문서화 작업을 할 수 있는 방법인, Rmarkdown에 대해 알아보도록 하겠다. Rmarkdown 이란? 우리가 보는 웹페이지는 기본적으로 모두 html 코드로 되어있다. 그래서 일반적으로 웹페이지를 만드려면 html 코드를 다룰 줄 알아야 한다. 하지만 markdown 을 사용하면, # 등의 기호들만 사용하여서도 html 코드를 작성하는 것과 같은 효과를 낼 수 있다. 하지만 이 markdown 이라는 것은 사용할 수 있는 특수한 환경이 필요한데, 그 환경 중 하나가 파로 Rmarkdown 이다. markdown으로 웹페이지를 작성하면 알아서 그에 맞는 html 코드로 변경해주는데, Rmarkdown도 마찬가지이다. RStudio 에서 Rmarkdown 만들기 위와 같.. 2023. 5. 29.