반응형 코딩9 상자수염 논문 그래프 (Box and whisker plot, 파이썬, Q1, Q2, Q3 계산) 상자수염 그래프 (Box and Whisker Plot)는 수치형 데이터의 분포와 이상값 (Outlier)을 시작적으로 표현하는 그래프이다. 주로 다수의 그룹이 있는 데이터에서 그룹 간 비교할 때 사용된다. 즉, 상자수염그래프는 데이터 분석 및 시각화에서 자주 사용되는 그래프 중 하나이다. 예를 들면 아래와 같다. 다수의 그룹이 있는 실험 데이터의 분포를 비교하고자 할 때 자료의 중앙값, 사분위수 등 대표적인 수치를 파악하고자 할 때 이상치 (Outlier)가 있는 데이터 분포를 파악하고자 할 때 대용량의 수치 데이터를 효과적으로 표현하고자 할 때 오늘 목표 주피터 노트북으로 상자수염 그래프 그린 후, 최소값, Q1, Q2, Q3, 최대값 계산해 보기 예제, 데이터 A와 B 두 그룹이 각각 다른 공부 방.. 코딩 2023. 5. 4. 파이썬 엑셀파일에서 필요한 열 전체 추출 후 엑셀파일에 저장 (쥬피터 노트북) 실험을 하고 소프트웨어에서 데이터를 엑셀 파일로 임포트를 하면 정말 다양한 데이터가 나오는데요. 오늘은 하나의 엑셀파일에서 필요한 데이터를 추출하여 하나의 엑셀파일로 만드는 방법을 소개할게요. 주로 시계열 데이터를 다뤄서 열 전체 데이터를 추출해 보겠습니다. 아나콘다 패키지와 쥬피터 노트북을 사용합니다. 데이터 예제 아래 이미지와 같은 엑셀 파일에서 노란색으로 체크한 부분만 가져와 하나의 엑셀파일로 저장해 볼게요. 결과물은 아래 이미지를 참고해 주세요. 아래처럼 파일을 오픈하면 숫자가 이상하게 나오는데요. 표시형식에서 지수를 숫자로 변경해 주면 됩니다. 라이브러리 pandas와 numpy를 이용했습니다. from numpy import savetxt import pandas as pd 엑셀 데이터 경로 .. 코딩 2023. 1. 13. 파이썬 범례 추가하는 법 (순서바꾸기, 가로로 나열하기) 오늘 목표 오늘은 파이썬 범례를 다양하게 추가할 수 있는 방법을 알아보겠습니다. 특히, 범례를 가로로 나열하고, 범례 순서를 바꾸는 방법을 알아볼게요. 라이브러리 불러오기 import pandas as pd import matplotlib.pyplot as plt import matplotlib.patches as mpatches #범례 그리기 위한 라이브러리 import matplotlib.lines as mlines #범례 그리기 위한 라이브러리 데이터 불러오기 엑셀에 있는 데이터를 불러와서 작업을 주로 하지만, 오늘은 랜덤 한 시계열 데이터(time series)를 생성하여 그래프를 그려볼게요. 엑셀 데이터 불러와서 그래프 그리는 법은 여기에서 확인해 주세요. 2개의 그룹이 3가지의 컨디션에 해당하.. 코딩 2023. 1. 5. 엑셀 파일 csv로 변환 코드 (tsv, sto, xlsx ↔ csv) xlsx, tsv, sto 등의 파일명을 가진 파일을 파이썬을 이용해서 변환하려고 합니다. 파일을 오픈해서 [다른 이름으로 저장]을 선택한 후 원하는 파일명으로 변환해도 되지만, 변환해야 할 문서가 많은 경우에 유용하게 쓸 수 있습니다. 저 또한 많은 파일을 일일이 오픈해서 파일명을 바꿔주다가 코드를 사용해봤는데 훨씬 효율적이더라고요. 참고 tsv = Tab-spearated values (값들이 탭으로 구분 되어 있는 파일 형식) csv = Comma-spearated values (값들이 쉼표(,)로 구분 되어 있는 파일 형식) sto = Storage files (OpenSim 파일) 오늘 목표 xlsx, tsv, sto 파일 등을 csv 파일로 변환하기 ① xlsx 파일을 csv로 변환하기 ② t.. 코딩 2021. 6. 17. 데이터 마이닝 :: 케이무크 무료 대학 강의 케이무크 :: 데이터 마이닝 강의 1-2주 차 강의 복습 노트 1. 빈발 아이템 개념과 정의 2. 연관 규칙 ① 서포트 ② 컨피던스 ③ 인터레스트니스 3. 빈발 아이템 셋 찾기 위한 알고리즘 ① A-priori ② PCY ③ Randomsampling ④ SON 1. Market-basket model 슈퍼에서 고객들의 장바구니에 담긴 물건들을 모두 파악하고, 어떤 물건들이 서로 연관성이 있는지 알아내려는 게 목적. 고객들의 장바구니가 input data 물건들의 연관성이 output 예를 들어 장바구니의 물건들 중 기저귀와 우유를 산 고객들의 장바구니에는 맥주가 빈번하게 담겨 있더라는 정보를 찾을 수 있다. 이런 정보를 이용해서 기저귀나 우유 옆에 맥주를 진열하는 등의 마케팅을 할 수 있을 것. 데이터.. 코딩 2021. 6. 12. 엑셀 파일 CSV 변환, 파이썬으로 파일 불러오기, 데이터 추출 3가지 방법, 그래프 그리기 (pd.read_csv VS np.loadtxt) 오늘 목표 엑셀로 작업한 파일을 CSV로 변환하고, 그것을 파이썬으로 불러오고, 불러온 파일에 있는 데이터를 추출하는 방법을 소개하겠습니다. Jupyter notebook에서 python3로 실행했습니다. 오늘 목표는 아래와 같습니다. 엑셀 파일 CSV로 변환하기 파이썬으로 CSV 파일 불러오기 (2가지 방법) pd.read_csv ('파일 경로') np.loadtxt ('파일 경로') 데이터 추출 하기 (3가지 방법) 간단히 산점도 그래프 그리기 엑셀 파일 CSV로 변환하기 엑셀에서 [파일]-[다른 이름으로 저장] 선택 후에 파일 저장할 때 [파일 이름] 입력하고, 그 아래 파일 형식에서 [CSV(쉼표로 분리)]를 선택합니다. 엑셀 파일 자체를 파이썬으로 불러오고 데이터도 추출할 수 있지만, 프로그래밍.. 코딩 2021. 5. 22. 파이썬 그래프 범례 내 맘대로 수정하는 법 (matplotlib) 오늘 목표 오늘은 파이썬 그래프 범례를 여러가지 스타일로 바꾸어 보는 방법을 알아 보겠습니다. 라이브러리 가져오기 import matplotlib from matplotlib import font_manager,rc #한글 폰트 입력을 위한 라이브러리 import matplotlib.pyplot as plt #그래프 그리기 위한 라이브러리 import matplotlib.patches as mpatches #범례 그리기 위한 라이브러리 import matplotlib.lines as mlines #범례 그리기 위한 라이브러리 %matplotlib inline 데이터 입력하기 데이터를 직접 값만 입력해도 되고 엑셀에 있는 자료를 가져와도 됩니다. 오늘은 리스트형태로 평균과 표준편차를 입력해 보겠습니다. y.. 코딩 2020. 12. 18. 파이썬 그래프에 한글 제목과 범례 사용하는 법 오늘 목표 지난 포스팅에서 연속적인 엑셀 데이터를 이용하여 평균과 표준편차를 나타내는 라인 그래프를 그렸었는데요. 오늘은 그 데이터와 그래프를 그대로 가져와서 한글로 차트 제목, 축 제목을 나타내는 법을 알아보도록 하겠습니다. 아래와 같은 그래프를 만드는 것이 오늘 목표입니다. 한글 사용 위한 라이브러리 가져오기 아래와 같이 라이브러리를 가져옵니다. import matplotlib from matplotlib import font_manager,rc #한글 폰트 입력을 위한 라이브러리 import matplotlib.pyplot as plt #그래프 그리기 위한 라이브러리 %matplotlib inline 한글 저장 경로 가져오기 폰트는 보통 아래 경로에서 확인 할 수 있습니다. 가져오고 싶은 한글 폰트.. 코딩 2020. 12. 18. 파이썬 엑셀 데이터로 라인 그래프 그리기 with 평균, 표준편차 (matplotlib) 오늘 코딩 목표 파이썬 시각화 라이브러리 중에 matplotlib를 이용하여 평균과 표준편차가 있는 라인 그래프를 그려보겠습니다. 그런 뒤 다양하게 그래프를 수정해 보겠습니다. 아래 왼쪽의 엑셀 그래프를 이용하여 아래 오른쪽과 같은 그래프를 만드는 것이 오늘의 목표입니다. 라이브러리 가져오기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline #주피터 노트북 사용시 필요한 코드 엑셀 CSV 파일 가져오기 pandas 를 이용하여 csv 파일을 가져옵니다. df라고 파일명을 정해줬고, csv 파일이 있는 경로를 복사해 와서 붙여 넣어 줍니다. 이때 복사해 온 주소는 백슬레쉬 상태이니 슬래쉬 상태로 바꿔줘야 하고요. skiprows .. 코딩 2020. 12. 17. 이전 1 다음 반응형