본문 바로가기

분류 전체보기91

R - 데이터 분석 (3) : dplyr 패키지 이번 포스팅에선 R에서 데이터 분석을 할 때 tidyr과 항상 같이 사용되는 dplyr 패키지와 주요 함수들에 대해 간단히 정리해보도록 하겠다. tidyr 패키지의 함수들이 데이터프레임의 틀을 조정하는 느낌이었다면, dplyr 패키지의 함수들은 직접적으로 작업을 실행하는 느낌이다. SQL을 공부할 때에도 여러 함수들을 다뤘었는데 그 함수들과 역할이 거의 비슷하다. 우선 코드 진행에 필요한 dplyr 패키지와, 데이터셋으로 사용할 nycflights13 패키지를 로드해준다. library(dplyr) library(nycflights13) flights SQL에서 가장 먼저 공부한 함수가 select 였는데, dplyr에도 역시 select 함수가 있다. 열을 선택하는 것은 데이터 분석의 가장 기초적인 수.. 2023. 5. 21.
R - 데이터 분석 (2) : tidyr 패키지 포스팅이 많이 늦어져 버렸다. 이번 포스팅에선 데이터 프레임을 깔끔하게 정리할 수 있는 tidyr 패키지와 그 함수들에 대해서 간략하게 정리해보고자 한다. 데이터를 깔끔하게 정리하는 것은 아주 중요한 일이다. 시각화 하기도 편하고, 데이터 분석 모델들을 사용하기에도 편하기 때문이다. 파이썬에서는 보통 pandas 패키지 안에 이렇게 tidy한 데이터를 만드는 데에 필요한 함수들이 다 들어있지만, R에는 tidyr 이라는 패키지가 있다. tidyr에서 중요하게 쓰이는 함수들을 간략하게 살펴보겠다. library(tidyr) table4a 함수들을 사용해보기 위해 tidyr 패키지에 들어있는 데이터셋 중 하나인 table4a 를 불러오도록 한다. 참고로 사용할 모든 table 들은 나라의 결핵 환자 수라고 .. 2023. 5. 20.
인공지능 ChatPDF 사용해서 논문 읽는 방법 공유 최근에 머신러닝과 딥러닝 등을 공부하면서 느낀 바가 많았는데, 그 중 하나가 최근까지도 연구가 워낙 활발히 진행되고 있다는 것이다. 더 중요하게 다가왔던 것은 책이나 강의들이 모두 결국엔 논문에서 나오기 때문에 논문 읽는 훈련을 해놓아야 한다는 것이었다. 하지만 일개 학부생이, 더구나 영어가 비모국어인 초심자가 영어로 된 논문을 쭈욱 읽기란 여간 어려운 일이 아니다. 그래서 최근 ChatGPT를 필두로 나온 수많은 생성AI 중 내가 유용하게 사용하고 있는 AI인 ChatPDF를 사용해 논문을 읽는 방법을 간략하게 소개해보고자 한다. ChatPDF https://www.chatpdf.com/ https://www.chatpdf.com/ ChatPDF is the fast and easy way to cha.. 2023. 5. 19.
R - 데이터 분석 (1) : Magrittr 과 파이프 오퍼레이터 최근에 R로 데이터를 분석하고 시각화하는 것을 배우고 있는데, 양이 많아서 차근차근 정리해보고자 한다. R의 최대 장점이라면 파이썬처럼 오픈라이브러리 방식이라는 점일 것이다. 다른 사람들이 만들어놓은 유용한 패키지들을 가져다가 적절하게 사용할 수 있다는 것이다. 파이썬과 R 의 대표적인 패키지들은 깊게는 알지 못하지만, 수박겉핥기 식으로 사용해봤을 때 R 의 패키지들이 더욱 다양한 기능들을 제공해주는 느낌이 들었다. 특히 Tidyverse라고 하여 주요 패키지에서 끊임없이 확장, 추가 생성되는 일종의 유니버스까지 존재했다. 이번 포스팅에선 대표적인 패키지 중 하나인 Magrittr과 그 기능인 파이프 오퍼레이터에 대해서 정리하려고 한다. 파이프 오퍼레이터와 Magrittr Magrittr 패키지는 코드를.. 2023. 5. 6.
파이썬 - 유용한 함수 scipy의 optimize, minimize 활용해보기 오늘은 최근에 여러 공부를 하면서 굉장히 유용하다고 느낀 함수인 Scipy 패키지의 optimizie 함수에 대해 정리해보도록 하겠다. 내용의 출처는 ChatGPT와 https://scipy.org/ (패키지의 소개 홈페이지) 이다. Scipy 패키지 scipy 패키지는 여러 계산 과정에서 굉장히 유용하게 사용되는 패키지이다. 최적화, 보간법, 선형대수 등 여러 수학적인 계산을 넘어서 통계와 이미지 처리 까지 지원해주는 함수들이 내장되어 있다. 오늘 정리할 함수는 이 중 최적화를 도와주는 optimize function이다. Optimize 함수 https://docs.scipy.org/doc/scipy/tutorial/optimize.html# Optimization (scipy.optimize) — .. 2023. 5. 5.
머신러닝 - 차원 축소와 PCA (3) 이번 포스팅은 PCA에 관한 마지막 포스팅으로, PCA를 통해 분류를 해보도록 하겠다. 그리고 깜빡하고 저번 포스팅에도 명시를 하지 않은 것 같은데, 포스팅에서 다루는 내용의 출처는 수업시간에 배우는 소위 도마뱀책이라고 불리는 hands-on machine learning 이라는 책이다. 그리고 코드의 출처 또한 책과 이어지는 Github 이다. https://github.com/tuitet/Hands-On-Machine-Learning-with-Scikit-Learn-Keras-and-TensorFlow-3rd-Edition GitHub - tuitet/Hands-On-Machine-Learning-with-Scikit-Learn-Keras-and-TensorFlow-3rd-Edition: A seri.. 2023. 4. 15.