본문 바로가기
엑셀(Excel)/파워쿼리

[파워쿼리 2강] 웹에서 데이터를 쉽게 추출해보자(엑셀자동화 데이터추출)

by Serendipity_ 2022. 4. 12.
반응형

5시 50분 퇴근 10분 전이다.

퇴근만 바라보고 있는데 팀장님이 나에게 과제를 시켰다. 

 

최근 포켓몬스터 띠뿌띠뿌씰이 유행이다. 

https://www.etoday.co.kr/news/view/2110544

 

[요즘, 이거] 돌아온 포켓몬빵…‘띠부띠부씰’에 열광하는 90년대생

(김다애 디자이너 mnbgn@)용돈을 다 썼던 어린이는 월급을 쏟아붓는 어른이가 되었다. 그때도 지금도 내 주머니의 선택은 언제나 너였다. 포켓몬빵.노

www.etoday.co.kr

 

팀장님께서 포켓몬스터 1세대의 데이터를 정리해주고, 앞으로도 포켓몬이 매일 업데이트 될 수 있으니 일별 보고를 해달라고 하였다. 

인터넷에 찾아보니 표로 잘 정리되어 있긴하다.

이제 매일 복사 붙여넣기 노가다를 해야할 일이 추가되었다. 

 

하지만 파워쿼리로 하면 매일 '새로고침'만 누르면 쉽게 업데이트가 가능하다. 

 

Step1) 웹에서 데이터를 끌고 올 형태를 찾아서 주소를 복사 붙여넣기 한다. 

- 엑셀 빈 시트를 연다 → 데이터 탭  새 쿼리  기타 원본에서  웹에서

- 표 형태로 담겨있는 데이터를 끌고 올 수 있다. 

- 인터넷에서 찾아보니 나무위키에 1세대 포켓몬이 잘 정리되어 있다. 

- URL 주소 : https://namu.wiki/w/%ED%8F%AC%EC%BC%93%EB%AA%AC%EC%8A%A4%ED%84%B0/%EB%AA%A9%EB%A1%9D/1%EC%84%B8%EB%8C%80?from=1%EC%84%B8%EB%8C%80%20%ED%8F%AC%EC%BC%93%EB%AA%AC

 

파워쿼리를 통해 웹주소 입력

해당  URL 주소를 붙여넣는다. 

주소 복사 붙여넣을 창

 

Step2) 필요한 데이터 테이블을 찾아 로드한다. 

- 웹에서 '표' 형태로 정리된 게 4개 있다.

- 그 중에서 우리에게 필요한 건  'Table3' 의 내용이다. 

- 아래 쪽에 보면 '로드', '다음으로 로드', '편집' 등의 내용이 있다. 

- '로드'는 엑셀 시트로 불러와줘, '다음으로 로드'는 엑셀 시트로 부르긴 부를껀데 잠깐 있어봐, '편집'은 일단 데이터 좀 수정해볼까? 정도로 이해해주면 된다. 

- 이번 블로그는 우선 웹에서 데이터를 부르는 게 목적이므로 '로드'만 한다. 

 

데이터를 로드한다.

 

Step3) 짜잔 ~~ ! 데이터가 웹에서 다 추출되었다. 

- 이제 웹에서 추가되는 데이터가 있다면 셀에 마우스 우클릭 후 '새로고침' 버튼만 누르면 자동으로 파워쿼리가 웹을 통해 데이터를 추가해준다. 

- 일별 업데이트는 엑셀 파일에 들어가서 새로고침으로 1초만에 가능해진다. 

데이터를 추출한 결과
새로고침 버튼을 통해 업데이트 가능

 

 

Step4) 이후과정

- 현재 데이터로는 불필요한 내용이 많다. 

- 이 정도로 파워쿼리 내용이 끝난다면 노가다가 나을지도 모른다. 

- 이후 과정은 데이터 로드 전 편집을 통해 지속 반복적인 노가다를 어떻게 파워쿼리를 통해 줄어들 게 할 수 있는지를 보여줄 예정이다. 

- 예시) 불필요한 행, 열 제거 / 동일한 타입의 경우, 하나만 표시 등

 

 

반응형

댓글