여러 데이터 쉽게 불러오기

Data Science

여러 데이터 쉽게 불러오기

태지쌤 2023. 1. 31. 20:00

import pandas as pd
from time import time

# Load data (pandas version)
start = time()
train = pd.read_csv('./data/transactions_train.csv')
end = time()
print(f"데이터 로드 시간 : {end-start}초")
train

# Check memory usage
mem_usage = train.memory_usage(deep=True).sum() / 1024 / 1024 / 1024
print(f"Memory Usage : {mem_usage:.4} GiB")

# parquet로 다시 만들어봅시다. 데이터의 일부만 가져옵니다.
part = pd.read_csv('./Downloads/transactions_train.csv',
                  nrows = 1000)
part2 = pd.read_csv('./Downloads/transactions_train.csv',
                  usecols=['t_dat','sales_channel_id'])
part2

sales = part["sales_channel_id"].value_count() * 0

for chunk in pd.read_csv('./Downloads/transactions_train.csv',
                        chunksize=3000000):
    print(chunk["sales_channel_id"].value_counts())
    sales = sales + chunk["sales_channel_id"].value_counts()
sales

train.loc[train["t_dat"] > '2020-06-01']

저작자표시 비영리 변경금지 (새창열림)

'Data Science' 카테고리의 다른 글

[판다스] 여러 엑셀 파일 합치기 (0)	2023.01.31
seaborn 그래프_경향성_크기_분포 파악 (0)	2023.01.31
살아움직이는 그래프 plotly (0)	2023.01.31
판다스 기초 피벗 테이블 (0)	2023.01.31
[파이썬] 웹크롤링 주식 데이터 가져오기 (0)	2023.01.30

현재글여러 데이터 쉽게 불러오기

태지쌤의 로봇/코딩교육 연구소

로보빌더, 로봇, 큐보, 프로보, 파이썬, 초등, 태지쌤, 로보로보, 오산맛집, rq, eq, 방과후, 로보스톤, 코딩, 과학, 로보티즈, 동탄맛집, 신사동맛집, 코딩교육, 엔트리,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

여러 데이터 쉽게 불러오기

'Data Science' 카테고리의 다른 글

'Data Science'의 다른글

티스토리툴바

여러 데이터 쉽게 불러오기

'Data Science' 카테고리의 다른 글

'Data Science'의 다른글

관련글

티스토리툴바