최근에 머신러닝과 딥러닝 등을 공부하면서 느낀 바가 많았는데, 그 중 하나가 최근까지도 연구가 워낙 활발히 진행되고 있다는 것이다. 더 중요하게 다가왔던 것은 책이나 강의들이 모두 결국엔 논문에서 나오기 때문에 논문 읽는 훈련을 해놓아야 한다는 것이었다. 하지만 일개 학부생이, 더구나 영어가 비모국어인 초심자가 영어로 된 논문을 쭈욱 읽기란 여간 어려운 일이 아니다.
그래서 최근 ChatGPT를 필두로 나온 수많은 생성AI 중 내가 유용하게 사용하고 있는 AI인 ChatPDF를 사용해 논문을 읽는 방법을 간략하게 소개해보고자 한다.
ChatPDF
이름에서 ChatGPT의 향기가 물씬 나는 사이트인 ChatPDF는 사실 OpenAI에서 만든 인공지능은 아니다. ChatGPT의 API를 가져와서 만든 사이트인지도 확실하진 않은데, 아무튼 ChatGPT와 거의 대등한 성능을 내고 있는 것으로 보인다. 어쩌면 아주 똑같을 수도 있고. 중요한 것은 '왜' 인지 보다는 이 사이트가 '무엇'을 할 수 있는지 일 것이다.
ChatPDF의 링크를 타고 들어가면 바로 사이트를 이용할 수 있다. GPT와는 다르게 로그인이 필요하지 않다는 점도 장점이다. 메인 인터페이스도 깔끔하여 바로 무엇을 하면 되는지 알 수 있다. 저 박스에 가지고 있는 pdf 파일을 업로드 하면 되는데, 꼭 갖고 있지 않더라도 URL과 검색 엔진을 통해서도 pdf 파일을 업로드 할 수 있다.
나는 이번에 저명한 통계학자이자 데이터 분석가, 그리고 RStudio의 수석 과학자인 Hadley Wickham 이 쓴 논문 Tidy Data를 읽어보기로 했다.
파일을 업로드하자마자 간략하게 pdf를 요약해주고, 답변 가능한 질문들의 예시를 보여준다. 즉, ChatPDF는 pdf 파일을 빠르게 읽은 뒤 사용자가 하는 질문에 대해 pdf 파일에 있는 내용에 한하여 답변을 해주는 인공지능이다. 물론 논문을 아예 읽지 않아도 질문할 수 있다.
이런 식으로 핵심이 무엇인지 물어보거나, 특정 부분을 요약해달라고 하면 아주 깔끔하게 정리해준다. 이렇게 논문의 끝까지 다 요약해 달라고 하면, 결국 논문 한 편의 요약본을 만들 수 있는 셈이다. 요약을 읽은 뒤 논문을 읽어 더 자세한 부분을 공부하다 모르는 내용이 나오면 또 질문하여 대답을 들을 수 있다.
그래서 최근에 이런 식으로 논문 여러 편을 빠르게 읽을 수 있었다. 사용 시 유의할 점은 논문에 없는 내용에 대해선 정확한 답변을 기대하기 어렵고, 생각보다 질문을 잘 이해하지 못 하기 때문에 명확하게 질문해야 한다는 것이다. 하지만 어떤 때엔 pdf에 없는 내용도 답변이 돌아오기도 하니, 우선 질문을 해보고 보는 것이 좋은 방법이겠다.
여담으로 이런 식으로 전혀 쌩뚱맞은 질문을 해도 답변을 해주는 것을 보아, 추측컨대 ChatGPT의 API인 것이 맞는 것 같다.
'LLM' 카테고리의 다른 글
[LLM] LLM으로 Tabular Data 학습해보기 - 1. GPT4o Finetuning (경정데이터분석) (9) | 2024.09.20 |
---|---|
[LLM] OPENAI 새로운 모델 ChatGPT o1 사용 후기 (10) | 2024.09.15 |
LLM - ChatGPT로 학습 데이터를 생성하는 방법 - 텍스트 데이터, 프롬프트 엔지니어링 (0) | 2024.03.27 |
[LLM] Deeplearning.AI Langchain 강의 내용 정리 (0) | 2024.02.10 |
LLM - RAG 란 무엇일까? 간단하게 이론 정리 (4) | 2023.12.07 |