본문 바로가기

분류 전체보기78

파이썬 오류 기록 - LGBM, Python, Dask 관련 AttributeError 오랜만에 주피터 노트북에서 lgbm 모델을 사용하려고 했는데 아래와 같은 오류를 확인했다. import pandas as pd import lightgbm as lgb AttributeError: module 'pandas.core.strings' has no attribute 'StringMethods' lightgbm (경황이 없어서 캡쳐를 하지 못 했다.) 오류가 난 부분은 lightgbm 을 import 하는 코드였다. 어째서 이런 오류가 났는지 ChatGPT에 우선 물어봤는데, pandas의 버전이 compatible하지 않는다고 lightgbm을 update하라는 답변이 돌아왔다. 하지만 pip 로 update를 한 결과 이미 최신버전이었고, pandas도 마찬가지로 최신이어서 더 할 것이 없.. 2023. 6. 4.
머신러닝 - Bootstrap 정리 with 중심극한정리, R 머신러닝에 대한 포스팅을 거의 하지 않았으나 공부는 꾸준히 하고 있었는데 (학교에서), 최근에 Bagging 과 Boosting에 대해서 배우고 있다. 그런데 이 부분에서도 Resampling 에 대해 배울 때 배웠던 Bootstrap 기법이 꽤 중요한 개념으로 작용하고 있다는 것을 알게 되었다. 그래서 Bootstrap 부터 시작해서, Tree 모형들 더 나아가 Random Forest 와 Bagging, 그리고 Boosting에 대해 쭉 정리해보고자 한다. 이번 포스팅에선 Bootstrap 기법에 대해 정리해보도록 하겠다. 포스팅하면서 참고한 자료는 다음과 같다. https://www.youtube.com/playlist?list=PLoROMvodv4rOzrYsAxzQyHb8n_RWNuS1e http.. 2023. 5. 31.
R - Rmarkdown 사용해서 문서 만들기 (2) 오늘은 Rmarkdown 으로 표, 그림 등 여러 자료들, 기능들을 어떻게 첨부할 수 있을지 정리해보도록 하겠다. HTML, CSS 적용 Rmarkdown 에선 일반적인 markdown과는 달리, 그냥 html 코드를 쳐도 알아서 시행이 된다고 한다. 사실 html과 css에 대해선 아는 바가 거의 없기 때문에, 예제를 통해 이런 것도 있구나 하고 넘어가려고 한다. 위와 같은 html 코드를 Rmarkdown에 입력한다. 이는 CSS 의 스타일을 정해놓은 html 코드이다. # My HTML and CSS Example This is a header with custom CSS styling. This paragraph has custom CSS styling as well. 그리고 위와 같은 코드를 입.. 2023. 5. 30.
R - Rmarkdown 사용해서 문서 만들기 (1) 오늘은 RStudio 를 이용해서 문서화 작업을 할 수 있는 방법인, Rmarkdown에 대해 알아보도록 하겠다. Rmarkdown 이란? 우리가 보는 웹페이지는 기본적으로 모두 html 코드로 되어있다. 그래서 일반적으로 웹페이지를 만드려면 html 코드를 다룰 줄 알아야 한다. 하지만 markdown 을 사용하면, # 등의 기호들만 사용하여서도 html 코드를 작성하는 것과 같은 효과를 낼 수 있다. 하지만 이 markdown 이라는 것은 사용할 수 있는 특수한 환경이 필요한데, 그 환경 중 하나가 파로 Rmarkdown 이다. markdown으로 웹페이지를 작성하면 알아서 그에 맞는 html 코드로 변경해주는데, Rmarkdown도 마찬가지이다. RStudio 에서 Rmarkdown 만들기 위와 같.. 2023. 5. 29.
시계열 데이터 - ACF, PACF 로 ARIMA 모델 계수, 차수 선택하기 저번 방학에 혼자 시계열 데이터를 공부하면서 ARIMA 모델에 대해 다루었다. 그때 당시에 혼자서 공부하다 보니 자세히 몰랐던 부분이 있었는데, 학기 중에 시계열 데이터 수업을 들으면서 확실히 알게 된 내용이 있어 정리하고자 한다. 바로 ACF, PACF 그래프 보고 ARIMA 모델의 차수 p, q 를 선택하는 방법이다. (출처 : 수업자료, 수업자료의 출처는 아래 교재입니다.) https://www.wiley.com/en-ie/Applied+Econometric+Time+Series,+4th+Edition-p-9781118808566 https://tiabet0929.tistory.com/8 시계열 데이터 - AR,MA,ARIMA 모델 시계열 데이터 공부를 시작하고 거의 한 달 만에 ARIMA 모델까지.. 2023. 5. 27.
R - 데이터 분석 (3) : dplyr 패키지 이번 포스팅에선 R에서 데이터 분석을 할 때 tidyr과 항상 같이 사용되는 dplyr 패키지와 주요 함수들에 대해 간단히 정리해보도록 하겠다. tidyr 패키지의 함수들이 데이터프레임의 틀을 조정하는 느낌이었다면, dplyr 패키지의 함수들은 직접적으로 작업을 실행하는 느낌이다. SQL을 공부할 때에도 여러 함수들을 다뤘었는데 그 함수들과 역할이 거의 비슷하다. 우선 코드 진행에 필요한 dplyr 패키지와, 데이터셋으로 사용할 nycflights13 패키지를 로드해준다. library(dplyr) library(nycflights13) flights SQL에서 가장 먼저 공부한 함수가 select 였는데, dplyr에도 역시 select 함수가 있다. 열을 선택하는 것은 데이터 분석의 가장 기초적인 수.. 2023. 5. 21.