본문 바로가기

전체 글51

[파이썬] Python 데이터 분석 기본환경설정 최근 엑셀 파워쿼리보다 Python으로 데이터 분석을 많이 진행한다. 엑셀보다 성능이 좋고, 빠르기 때문이다. 엑셀은 100만행이 조금 넘어가면 더 이상 데이터를 저장할 수 없지만 Python은 200만행 넘는 것도 거뜬히 불러온다. 다만 코드로 쓰다보니 엑셀보다 어렵다. 오늘은 기본적으로 데이터 분석할 때 기본적으로 쓰는 환경설정에 대해 공유하고자 한다. 1. 라이브러리 임포트 1 2 3 4 5 6 7 8 # 라이브러리 import import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns 파이썬은 프로그래밍 언어 중에 쉬운편에 속하는데, 똑똑한 누군가가 이런 라.. 2022. 7. 17.
[엑셀꿀팁] VLOOKUP, INDEX & MATCH, 파워쿼리 병합 비교해보자_3탄 !! 파워쿼리로 Vlookup 해보자 마지막으로 vlookup의 끝판왕..! 파워쿼리를 통해 데이터를 가져오는 방법에 대해 알려드리겠습니다. 매번 vlookup으로 타이핑 하는 것도 이젠 귀찮으실 시기입니다. 우선 파워쿼리 창을 만들어주기 위해 이제까지 많이 해왔던 표만들기 부터 시작하겠습니다. 01. 표 지정하기 vlookup 해야할 데이터 → '표' 지정(단축키 : Ctrl + T) vlookup 끌고올 데이터 → '표' 지정(단축키 : Ctrl + T) ※ 표 이름도 넣으면 좋습니다. 02. 파워쿼리 편집창 이동(데이터 탭 > 테이블에서) 03. 표 데이터 타입변경 이번 데이터는 데이터 타입 변경할 게 없습니다. 04. 다음으로 로드 포켓몬을 빨간 박스로 표시한 이유는 고유값이기 때문입니다. 고유값은 vlookup시에 불러올 수 있는 .. 2022. 6. 28.
[엑셀꿀팁] VLOOKUP, INDEX & MATCH, 파워쿼리 병합 비교해보자_2탄 !! INDEX & MATCH 함수에 대하여 드디어 INDEX & MATCH 를 이용하여 VLOOKUP의 심화버전을 보여드릴 수 있게 되었습니다. 지난 번 VLOOKUP의 경우, 여러 열을 끌고 와야할 경우 일일이 숫자를 변경해야 하는 불편함이 있었습니다. INDEX & MATCH를 쓰게 되면 그런 불편함 없이 한 번에 예쁘게 숫자를 들고 올 수 있습니다. 다만 이번 편은 VLOOKUP의 심화편인 만큼 아주 사알짝 복잡하지만 유용하게 써먹을 수 있습니다.(혼합참조 주의) 01. INDEX함수 사용법 기본 - INDEX함수는 전체 범위에서 어디 부분에 위치하는 지를 찾아내는 함수입니다. 무조건 예시로 이해하시면 됩니다. ■ INDEX 함수 예제 1행, 2행, 3행과 A열, B열, C열로 구성된 표가 있습니다. 각 행과 열에는 그에 맞게 좌표를 구성하.. 2022. 6. 7.
[파이썬 / Python] 업무자동화에 대한 생각_크롤링 예시 엑셀, 파워쿼리, 파이썬 등을 공부하면서 가장 좋았던 부분은 바로 단순반복업무를 내가 하지 않아도 된다는 점이었다. 단순반복업무는 컴퓨터가 나보다 훨~~씬 잘한다. 컴퓨터에게 단순반복업무를 맡기는 것에 대한 주관적 생각이다. 1. 실수가 줄어든다. - 처음 입사했을 때 9시 출근이지만 8시에 출근해서 엑셀 데이터를 수작업 하며 9시까지 보고했다. - 아침에 1시간 일찍 출근하여 1시간 동안 데이터가 틀린 게 없나 집중적으로 보았음에도 실수할 때가 있었다. (당시 수작업) - 엑셀을 자동화한 이후 실수가 굉장히 많이 줄었다. 2. 빠르다. - 오전에 8시에 출근해서 1시간 동안 하던 일을 복사 + 붙여넣기로 끝낼 수도 있다. - 10분 정도 검토 후 제출이 가능하다. 3. 단순반복 업무에 대한 회의감이 .. 2022. 6. 4.
[파워쿼리 6강] 엑셀 질문지를 예쁘게 만들어보자 _ 엑셀 자동화(피벗) 회사 동기의 아이디어로 제작하였습니다. [상황] 협력사에서 질문 문항에 대한 데이터를 엑셀로 제공했는데, 특이하게도 언피벗된 형태로 주었다. 테이블은 다음과 같다. ※ 사람 이름은 랜덤하게 뽑아주는 사이트에서 임의로 추출하였습니다. 질문에 대해서 각 사람별로 데이터를 취합해서 준 것이다. 취합할 때 예쁘게 하여 전달주면 가장 좋겠지만 일이라는 게 마음처럼 잘 풀리진 않는다. 그래서 우리는 이 데이터를 각 사람당 질문 1 2 3 이런 형태로 보고싶다. 예를 들면 이런 형태이다. 협력사에서 준 테이블은 각 사람 당 질문 1, 2, 3이 있어서 한 눈에 보기가 불편했던 반면, 이런 형태로 주면 각 사람당 질문에 대한 답을 한 눈에 볼 수 있게 된다. 엇.. 뭔가 쉬운데 피벗테이블로 할 수 있을 것 같은데라는 .. 2022. 5. 28.
[엑셀꿀팁] Vlookup, Index & match, 파워쿼리 병합 비교 해보자 오늘은 회사 동기의 요청으로 엑셀에서 가장 많이 쓰는 vlookup기능을 설명하면서 vlookup의 심화버전도 함께 보여드리겠습니다. 이와 같은 함수를 사용하는 이유는 원본 데이터에서 필요한 데이터를 보기 위해 사용합니다. 다양한 목적이 있겠지만, 실무에서 일하다보면 꼭 필요하니 목적성에 대해서는 길게 설명하지 않겠습니다. 목차 vlookup 사용법 기본 vlookup & match 사용 응용 Index & match 사용법 파워쿼리 병합 1. vlookup 사용법 기본 - 마이크로 소프트 기준 정의- 테이블 또는 행에 따라 범위를 찾아야 하는 경우 VLOOKUP을 사용 합니다. 가장 간단한 형식의 VLOOKUP 함수는 다음과 같은 의미입니다. =VLOOKUP(찾아보는 항목, 반환할 값을 포함하는 범위의.. 2022. 5. 22.
[파워쿼리 5강] 엑셀 파일 병합_자동화 기본편 오늘은 자동화의 기본인 엑셀파일 병합에 대해서 배워보겠다. Python 등의 프로그래밍 언어나 VBA를 통해서 여러 개의 파일을 하나로 병합할 수 있으나 우리의 목적은 최단시간 최고효율이기 때문에 파워쿼리를 통해 아주아주 쉽게 파일을 병합해 보겠다. 혹시나 Python이나 엑셀VBA를 통해 파일 병합을 하고자 하면 아래 발행글 참조 바란다. ※ Update 사항 - VBA로 파일 병합해보기 2022.11.22 - [엑셀(Excel)/VBA] - [엑셀/VBA] 폴더 내 엑셀파일 한번에 통합하기(엑셀파일병합, 자동화기본) - Python으로 파일 병합해보기 2022.11.22 - [파이썬(Python)] - [파이썬/Python] 파이썬으로 폴더 내 엑셀파일 한번에 통합하기 파워쿼리의 강점은 GUI라는 부.. 2022. 5. 9.
[파워쿼리4강] 조건열 사용을 통한 중복데이터 제거 지난 번에 이어서 파워쿼리 편집 방법에 대해 배워보겠다. 파워쿼리의 매력적인 부분은 VBA나 코딩 등 진입장벽이 높지 않음에 있다. 편하게 클릭 몇번으로 쉽게 자동화 할 수 있다. 반복작업은 업의 흥미를 잃게 만든다. 특히나, 반복작업으로 인한 가치를 찾기 힘든 경우에 더더욱 그렇다. 우리는 단순히 시간을 아끼는 것이 아니라, 업에 대한 흥미를 놓치지 않기 위해 자동화를 공부해야한다. 파워쿼리에서 또 강력한 기능 중 하나가 바로 조건열이다. 활용방법은 다양하지만, 오늘은 바로 옆의 행과 중복되는 경우, 안보이게 표시하는 방법에 대해 설명하겠다. 파워쿼리 편집창으로 이동하여, '열 추가' 탭 → '조건 열'을 클릭한다. 우리가 해야 할 일은 '타입'열과 '타입2'열의 값이 동일하다면 (중복이라면) '타입2.. 2022. 4. 30.