태지쌤

로봇 & 코딩교육 No.1 크리에이터

자세히보기
반응형

전체 글 1795

웹 크롤링을 통한 데이터 수집

# 라이브러리 정의 import requests import bs4 import pandas as pd from selenium.webdriver import Chrome import time from tqdm.notebook import tqdm import warnings warnings.simplefilter('ignore') query = "삼성" # 수집할 데이터를 for문 밖에 둠 titles = [] # 제품명 prices = [] review_counts = [] buy_counts = [] published_dates = [] # 제품 등록일 favorites = [] driver = Chrome('./chromedriver') # for 문 밖. 한번만 실행 for page_no in ..

Data Science 2023.01.31

[판다스] 여러 엑셀 파일 합치기

pip install openpyxl import pandas as pd from glob import glob from tqdm.notebook import tqdm import os # glob 함수를 이용해서 엑셀파일 목록을 가져옵니다. stations_files = glob('./data/*.xls') total = pd.DataFrame() for file_name in stations_files: temp = pd.read_excel(file_name, header = 2) total = pd.concat([total, temp]) total = total.sort_values(by="지역") total = total.reset_index(drop = True) # 기존 인덱스 날리기 tota..

Data Science 2023.01.31

seaborn 그래프_경향성_크기_분포 파악

# 라이브러리와 데이터를 불러오고, 시각화를 위한 세팅을 합니다. import seaborn as sns sns.set_theme(style='whitegrid') penguins = sns.load_dataset("penguins").dropna() penguins # penguin 데이터에 lineplot을 출력합니다. 질량에 따른 발길이 sns.lineplot(data=penguins, x="body_mass_g", y= "flipper_length_mm", ci = None) # penguin 데이터에 lineplot을 출력합니다. 질량에 따른 발길이 # 종별로 보고 싶을 때 옵션 sns.lineplot(data=penguins, x="body_mass_g", y= "flipper_length_m..

Data Science 2023.01.31

판다스 기초 피벗 테이블

#!/usr/bin/env python # coding: utf-8 # ## 02. 테이블 = DataFrame # ### 이번 실습에서는 다음 내용들을 배웁니다. # # # - pandas의 기본 구조인 DataFrame을 이해하고, pandas에 대한 다양한 데이터 처리 기능에 대해 배웁니다. # # # - 파이썬에서 엑셀 데이터를 사용하는 방법에 대해 배웁니다. # In[2]: # pandas 라이브러리를 불러옵니다. pd를 약칭으로 사용합니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # - DataFrame은 2차원 테이블이고, 테이블의 한 줄(행/열)을 Series라고 ..

Data Science 2023.01.31

여러 데이터 쉽게 불러오기

import pandas as pd from time import time # Load data (pandas version) start = time() train = pd.read_csv('./data/transactions_train.csv') end = time() print(f"데이터 로드 시간 : {end-start}초") train # Check memory usage mem_usage = train.memory_usage(deep=True).sum() / 1024 / 1024 / 1024 print(f"Memory Usage : {mem_usage:.4} GiB") # parquet로 다시 만들어봅시다. 데이터의 일부만 가져옵니다. part = pd.read_csv('./Downloads/t..

Data Science 2023.01.31

[신사동 맛집] 가성비 복자네 부대찌개

오늘 소개해드릴 식당은 신사동에 있는 복자네 부대찌개에요. 래미안신사아파트 근처에 있구요. 지하는 아니지만 계단으로 내려가야해서 눈 왔을 때는 살짝 위험할 수 있어요.​ ​ ​ 신사동 부대찌개 맛집 복자네 부대찌개는 오픈시간은 11시이고 10시에 마감해요.​ ​ ​ 복자네 부대찌개 실내 모습이구요. 테이블이 생각보다 많아요.​ ​ ​ 복자네 부대찌개지만 부대찌개 외에도 다양한 메뉴가 있어요. 부대찌개는 종류가 여러가지가 있어요. 기본 복자네 부대찌개가 있고 윌리스 부대찌개, 카봇 부대찌개가 있는데 재료가 어떻게 다른지는 모르겠어요.​ ​ ​ 기본 밑반찬이구요. 음.. 떡볶이는 그냥 차더라구요. 이럴거면 그냥 안 내놓는 게 좋을 듯​ ​ ​ 복자네 부대찌개구요. 재료가 다양하면서 풍성해요.​ ​ ​ 이건 ..

이것저것 2023.01.30

[파이썬] 웹크롤링 주식 데이터 가져오기

# -*- coding: utf-8 -*- """CH 02_02.주식 데이터 가져오기.ipynb Automatically generated by Colaboratory. Original file is located at https://colab.research.google.com/drive/12NAlW9QiyWko31SpWwBoYRMxJue-Drt0 """ # 해당 페이지의 page source를 직접 가져옵니다. 웹페이지에서도 우클릭 "페이지 소스 보기"로 같은 HTML 소스를 볼 수 있습니다. import requests import bs4 page_no = 1 page_url = f'https://finance.naver.com/sise/sise_index_day.naver?code=KPI200&p..

Data Science 2023.01.30

[대전도마동 맛집] 한누리 영양탕 묽은 국물(?)이 특징

오늘 방문한 곳은 대전도마동에 있는 한누리영양탕 도마중학교 근처에 있구요. 주차장이 없는 줄 알았는데 식당 바로 옆은 아니고 골목으로 들어가면 주택가에 주차장이 있어요. 도마동 맛집 한누리 영양탕 누렇게 바랜 간판이 오래된 식당이라는 걸 단숨에 알 수 있어요.​​ ​ ​ 11시부터 영업시작이고 3시부터 4시반까지는 브레이크타임이에요.​​ ​ ​ 한누리 영양탕 실내 공간은 넓어요. 공간 분리도 잘 되어있구요. 바닥에 앉는 곳과 테이블 섞여있어요.​​ ​ ​ 가격이 다른 영양탕에 비해서 비교적 저렴하더라구요. 특이한건 흑염소탕이 13000원 영양탕도 13000원 대부분 흑염소탕이 더 비싼데 가격이 동일하더라구요. 그래서 흑염소탕으로 주문했어요.​​ ​ ​ 기본 밑반찬이구요.​​ ​ ​ 도마동 맛집 한누리 영..

이것저것 2023.01.29

[신사동 맛집] 창화당 신사점 떡만두국

외부 미팅갔다가 늦은 점심을 위해 들린 곳 신사동 맛집 창화당 ​ 평소에 인기가 많아서 대기해야 하는데 오늘은 늦은 시간이라 바로 들어갔어요. ​ 배달이 가능해서 주변 직장인분들이 배달로도 많이 시켜드시더라구요. 만두 잘하는 집 신사동 맛집 창화당​ ​ ​ 추운날이라서 뜨거운 국물이 있는 떡만두국으로 주문해봤어요. 많이 푸짐하죠~?​ ​ ​ '만두 잘하는 집'이라는 수식어답게 만두의 크기가 진짜 엄청 커요. 종류도 고기만두, 김치만두 골고루 들어가있어서 좋았어요.​ ​ ​ 사골 육수도 맛있고~ 만두도 맛있고~ 신사동에서 떡만두국 드실거면 창화당 신사점 추천드려요~^^

이것저것 2023.01.29
반응형