반응형 전체 글175 데이터 마이닝 :: 케이무크 무료 대학 강의 케이무크 :: 데이터 마이닝 강의 1-2주 차 강의 복습 노트 1. 빈발 아이템 개념과 정의 2. 연관 규칙 ① 서포트 ② 컨피던스 ③ 인터레스트니스 3. 빈발 아이템 셋 찾기 위한 알고리즘 ① A-priori ② PCY ③ Randomsampling ④ SON 1. Market-basket model 슈퍼에서 고객들의 장바구니에 담긴 물건들을 모두 파악하고, 어떤 물건들이 서로 연관성이 있는지 알아내려는 게 목적. 고객들의 장바구니가 input data 물건들의 연관성이 output 예를 들어 장바구니의 물건들 중 기저귀와 우유를 산 고객들의 장바구니에는 맥주가 빈번하게 담겨 있더라는 정보를 찾을 수 있다. 이런 정보를 이용해서 기저귀나 우유 옆에 맥주를 진열하는 등의 마케팅을 할 수 있을 것. 데이터.. 코딩 2021. 6. 12. 엑셀 파일 CSV 변환, 파이썬으로 파일 불러오기, 데이터 추출 3가지 방법, 그래프 그리기 (pd.read_csv VS np.loadtxt) 오늘 목표 엑셀로 작업한 파일을 CSV로 변환하고, 그것을 파이썬으로 불러오고, 불러온 파일에 있는 데이터를 추출하는 방법을 소개하겠습니다. Jupyter notebook에서 python3로 실행했습니다. 오늘 목표는 아래와 같습니다. 엑셀 파일 CSV로 변환하기 파이썬으로 CSV 파일 불러오기 (2가지 방법) pd.read_csv ('파일 경로') np.loadtxt ('파일 경로') 데이터 추출 하기 (3가지 방법) 간단히 산점도 그래프 그리기 엑셀 파일 CSV로 변환하기 엑셀에서 [파일]-[다른 이름으로 저장] 선택 후에 파일 저장할 때 [파일 이름] 입력하고, 그 아래 파일 형식에서 [CSV(쉼표로 분리)]를 선택합니다. 엑셀 파일 자체를 파이썬으로 불러오고 데이터도 추출할 수 있지만, 프로그래밍.. 코딩 2021. 5. 22. Tongariro alpine crossing 통가리로 알파인 크로싱 여행 후기 1탄 (코스, 소요시간) 통가리로 알파인 크로싱 Tongariro alpine crossing + 요약 통가리로 크로싱 소요시간 Mangatepopo ~ Ketetahi car park 평균 6~8시간 준비물 물(인당 물과 이온음료 중간 사이즈로 1개씩 챙겼는데 딱 좋았음), 물티슈, 휴지, 도시락, 썬크림, 모자 셔틀버스 예약 저희는 Ketetahi 주차장에서 Ohakune 숙소까지 셔틀 신청했는데 인원이 별로 없다고 취소됐어요. 그래서 친구들이 데리러 왔습니다. 셔틀버스 예약은 이메일로 연락을 주는데 예약 및 취소 상태를 금방 알려줬어요. 그러니 미리 셔틀버스 예약해보시고 일정을 잡으시는 걸 추천드립니다. 뉴질랜드 북섬에 위치한 유명한 트랙킹 코스. 19.4 km 코스이며 평균 6시간에서 8시간 소요된.. 미국생활 2021. 2. 2. 미국 영수증 앱 4개월 사용 후기와 누적 포인트 (Fetch rewards/ibotta) 미국에 온 지 딱 4개월 차이다. 처음에 오자마자 알게 된 두 개의 영수증 리워드 앱. Fetch rewards와 ibotta 사용법과 그동안 모은 포인트와 리워드 받은 후기를 남겨보겠다. Fetch rewards Fetch rewards는 사용이 매우 간단하다. 진짜 아무 영수증을 찍어도 포인트를 주며 특정 브랜드를 구매한 이력이 영수증에 나타나면 추가로 보너스 포인트를 주는 방식이다. 우체국이나 한국 슈퍼 같은 곳에서 받은 영수증을 찍으면 15포인트 정도 준다. 하지만, hyvee, costco, 트죠 등과 같은 곳에서 받은 영수증을 찍었을 때는 더 많은 포인트를 받을 수 있다. 또한, 특정 브랜드를 특정 금액만큼 구입하면 4000 또는 만 포인트까지도 주는 프로모션도 진행하고 있다. 내가 애용하는 .. 미국생활/미국에서 재테크 2020. 12. 19. 파이썬 그래프 범례 내 맘대로 수정하는 법 (matplotlib) 오늘 목표 오늘은 파이썬 그래프 범례를 여러가지 스타일로 바꾸어 보는 방법을 알아 보겠습니다. 라이브러리 가져오기 import matplotlib from matplotlib import font_manager,rc #한글 폰트 입력을 위한 라이브러리 import matplotlib.pyplot as plt #그래프 그리기 위한 라이브러리 import matplotlib.patches as mpatches #범례 그리기 위한 라이브러리 import matplotlib.lines as mlines #범례 그리기 위한 라이브러리 %matplotlib inline 데이터 입력하기 데이터를 직접 값만 입력해도 되고 엑셀에 있는 자료를 가져와도 됩니다. 오늘은 리스트형태로 평균과 표준편차를 입력해 보겠습니다. y.. 코딩 2020. 12. 18. 파이썬 그래프에 한글 제목과 범례 사용하는 법 오늘 목표 지난 포스팅에서 연속적인 엑셀 데이터를 이용하여 평균과 표준편차를 나타내는 라인 그래프를 그렸었는데요. 오늘은 그 데이터와 그래프를 그대로 가져와서 한글로 차트 제목, 축 제목을 나타내는 법을 알아보도록 하겠습니다. 아래와 같은 그래프를 만드는 것이 오늘 목표입니다. 한글 사용 위한 라이브러리 가져오기 아래와 같이 라이브러리를 가져옵니다. import matplotlib from matplotlib import font_manager,rc #한글 폰트 입력을 위한 라이브러리 import matplotlib.pyplot as plt #그래프 그리기 위한 라이브러리 %matplotlib inline 한글 저장 경로 가져오기 폰트는 보통 아래 경로에서 확인 할 수 있습니다. 가져오고 싶은 한글 폰트.. 코딩 2020. 12. 18. 파이썬 엑셀 데이터로 라인 그래프 그리기 with 평균, 표준편차 (matplotlib) 오늘 코딩 목표 파이썬 시각화 라이브러리 중에 matplotlib를 이용하여 평균과 표준편차가 있는 라인 그래프를 그려보겠습니다. 그런 뒤 다양하게 그래프를 수정해 보겠습니다. 아래 왼쪽의 엑셀 그래프를 이용하여 아래 오른쪽과 같은 그래프를 만드는 것이 오늘의 목표입니다. 라이브러리 가져오기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline #주피터 노트북 사용시 필요한 코드 엑셀 CSV 파일 가져오기 pandas 를 이용하여 csv 파일을 가져옵니다. df라고 파일명을 정해줬고, csv 파일이 있는 경로를 복사해 와서 붙여 넣어 줍니다. 이때 복사해 온 주소는 백슬레쉬 상태이니 슬래쉬 상태로 바꿔줘야 하고요. skiprows .. 코딩 2020. 12. 17. 이전 1 ··· 12 13 14 15 다음 반응형