코딩

파이썬 엑셀파일에서 필요한 열 전체 추출 후 엑셀파일에 저장 (쥬피터 노트북)

Bella0204 2023. 1. 13.

실험을 하고 소프트웨어에서 데이터를 엑셀 파일로 임포트를 하면 정말 다양한 데이터가 나오는데요. 오늘은 하나의 엑셀파일에서 필요한 데이터를 추출하여 하나의 엑셀파일로 만드는 방법을 소개할게요. 주로 시계열 데이터를 다뤄서 열 전체 데이터를 추출해 보겠습니다. 아나콘다 패키지와 쥬피터 노트북을 사용합니다. 

 

 

 

 

데이터 예제

 

아래 이미지와 같은 엑셀 파일에서 노란색으로 체크한 부분만 가져와 하나의 엑셀파일로 저장해 볼게요. 

 

 

결과물은 아래 이미지를 참고해 주세요.  아래처럼 파일을 오픈하면 숫자가 이상하게 나오는데요. 표시형식에서 지수를 숫자로 변경해 주면 됩니다. 

 

 

 

 

 

 

라이브러리

 

pandas와 numpy를 이용했습니다.

 

from numpy import savetxt
import pandas as pd

 

 

엑셀 데이터 경로 지정

data = ('C:/Users/hykim/OneDrive/Desktop/FS data/FS1.csv')

엑셀파일이 있는 경로를 복사한 후 파일명 붙여서 경로 지정해 줬어요. 백슬래시(/)를 슬래시(\)로 바꿔줘야 합니다. 

 

 

 

필요한 데이터 추출

 

필요한데이터 = pd.read_csv(data, skiprows=1, delimiter=',', usecols =[13,26,37])

필요한 데이터가 14번째, 27번째, 38번째 열(column) 이라면, 파이썬은 시작이 0이기 때문에 usecols = [13, 26, 37]로 불러와야 합니다. skiprows = 1 은 첫 번째 행(row) 무시하고, 두 번째 행부터 가져오라는 뜻이에요. 

 

데이터 확인

 

필요한데이터.head()

원하는 데이터인지 확인합니다. 

 

 

하나의 엑셀 파일로 저장하기

 

저장할 경로 + 저장할 파일명을 작은따옴표 안에 지정해 줍니다. 

delimiter는 데이터를 어떻게 구분할 건지를 나타내는데요. csv는 콤마로 구분을 하니 콤마(,)로 지정해 줬어요. 

header는 큰따옴표 사이에 원하는 머리글 순서대로 입력해 주면 돼요. 

 

savetxt('C:/Users/hykim/OneDrive/Desktop/FS data/합친데이터.csv',필요한데이터, delimiter=',', header ="data1,data2,data3")

 

아래와 같이 지정한 경로에 지정한 파일명으로 필요한 데이터만 추출한 엑셀파일이 만들어 졌습니다. 

 

 

 

 

 

 

시계열 데이터 평균과 표준편차 계산하기

 

시계열 데이터는 가로로 평균을 내기 때문에 axis=1로 지정해 주어야 합니다. 

 

평균 = 필요한데이터.mean(axis=1)
표준편차 = 필요한데이터.std(axis=1)

 

전체코드

from numpy import savetxt
import pandas as pd

data = ('C:/Users/hykim/OneDrive/Desktop/FS data/FS1.csv')
필요한데이터 = pd.read_csv(data, skiprows=1, delimiter=',', usecols =[13,26,37])
필요한데이터.head()
savetxt('C:/Users/hykim/OneDrive/Desktop/FS data/합친데이터.csv',필요한데이터, delimiter=',', header ="data1,data2,data3")

 

 

다음에는 형식이 같은 여러 엑셀파일에서 필요한 데이터만 추출해서 하나의 엑셀파일로 만드는 법을 소개해 볼게요. 

 

반응형

댓글