[생활코딩/머신러닝야학] 레몬네이드 판매량 예측(1) - pandas

2021. 1. 11. 22:52·개발/머신러닝
728x90

먼저 모델을 만들기 전에, 데이터를 어떤 식으로 가져오고, 써야 하는지 알아야 한다.

1. 과거의 데이터를 준비

2. 모델의 구조를 만듬

3. 데이터로 모델을 학습(FIT)

4. 모델을 이용


준비운동

준비된 데이터로 독립, 종속변수 확인하기

import pandas as pd # pip install pandas

#파일로부터 데이터 읽어오기
lemonade = pd.read_csv('https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv')
boston = pd.read_csv('https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv')
iris = pd.read_csv('https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv')

#데이터 모양으로 확인하기
print('데이터 모양으로 확인하기 : lemonade = {} , boston = {}, iris = {}\n'.format(lemonade.shape, boston.shape, iris.shape))

#독립변수, 종속변수 분리하기 전
#컬럼이름 출력
print('<컬럼이름 출력> \n lemonade = {}\n boston = {}\n iris = {}\n'.format(lemonade.columns, boston.columns, iris.columns))

#독립변수, 종속변수 분리하기 
Independent_Variable = lemonade[['온도']]
Dependent_Variable = lemonade[['판매량']]
print('lemonade의 독립변수 = {}, 종속변수 = {}\n'.format(Independent_Variable.shape ,Dependent_Variable.shape))

Independent_Variable = boston[['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax',
       'ptratio', 'b', 'lstat']]
Dependent_Variable = boston[['medv']]
print('boston 독립변수 = {}, 종속변수 = {} \n'.format(Independent_Variable.shape ,Dependent_Variable.shape))

Independent_Variable = iris[['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭']]
Dependent_Variable = iris[['품종']]
print('iris 독립변수 = {}, 종속변수 = {} \n'.format(Independent_Variable.shape ,Dependent_Variable.shape))

#head 출력
#.head(5) - 5개만 출력
print('<head 출력>\n <lemonade>\n{}\n <boston>\n{}\n <iris>\n{}\n'.format(lemonade.head(5), boston.head(5), iris.head(5)))

실행 결과


opentutorials.org/course/4570/28971

 

표를 다루는 도구 '판다스' - 생활코딩

수업소개 '판다스'를 이용하여 데이터 다루는 방법을 배우는 수업입니다, 모델을 학습시키기 위하여 파일로부터 데이터를 읽어들이고, 독립변수와 종속변수를 분리하여 데이터 준비합니다.

opentutorials.org

 

728x90
저작자표시 비영리 변경금지 (새창열림)

'개발 > 머신러닝' 카테고리의 다른 글

[생활코딩/머신러닝야학] 보스턴 집값 예측  (0) 2021.01.12
[생활코딩/머신러닝야학] 레몬네이드 판매량 예측(2) - neural network  (0) 2021.01.11
[생활코딩/머신러닝야학] 머신러닝의 분류  (0) 2021.01.08
[생활코딩/머신러닝야학] 독립변수? 종속변수?  (0) 2021.01.08
[생활코딩/머신러닝야학] 행 - 관측치(observed value), 열 -특성(feature)  (0) 2021.01.08
'개발/머신러닝' 카테고리의 다른 글
  • [생활코딩/머신러닝야학] 보스턴 집값 예측
  • [생활코딩/머신러닝야학] 레몬네이드 판매량 예측(2) - neural network
  • [생활코딩/머신러닝야학] 머신러닝의 분류
  • [생활코딩/머신러닝야학] 독립변수? 종속변수?
호이호이209
호이호이209
이것저것 기록하는 메모장
    250x250
  • 호이호이209
    R=VD
    호이호이209
    • R=VD전체글 (83)
      • 개발 (63)
        • Linux (19)
        • 머신러닝 (10)
        • Git (6)
        • Python (9)
        • 프로그래밍 언어 (2)
        • Docker (5)
        • ETC (12)
      • 일상기록 (20)
        • 여행 (5)
        • 일상-이모저모 (8)
  • 인기 글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
호이호이209
[생활코딩/머신러닝야학] 레몬네이드 판매량 예측(1) - pandas
상단으로

티스토리툴바