'빅데이터 분석 서비스' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록빅데이터 분석 서비스 (12)

멀리 보는 연습

머신러닝_네이버 영화 리뷰 감성 분석

오늘의 TMI는 코로나19 백신 1차를 맞았다는 것이다. 12시가 넘었으니 어제가 되었지만, 나는 화이자 백신을 맞았다. 주변에서 팔을 못쓰게 된다는 짤을 많이 본 상태라서 겁을 많이 먹고 맞고 왔는데, 생각보다 팔팔하다. 내일 아침이 무서울뿐.. 나의 자랑(?) 중 하나가 감기에 잘 걸리지 않는다는 것인데, 내가 그만큼 면역력이 좋다고 믿고 싶고, 부디 내일 아무 탈 없이 지나가길 바란다. 하하.. 다음 주부터는 IoT 수업이 진행됨에 따라 모두 오프라인 등원을 한다. 하지만 다 같이 수업을 들을 수는 없어서 공간을 나누어 2개 반으로 수업이 진행된다. 우리는 7층으로 쫓겨났다. 힝ㅠㅠ 뷰 맛집이라 나름 만족중.. 다음 주 수업을 편하게 들으려면 이번 주까지 배웠던 머신러닝+딥러닝을 복습해야 하는데, ..

빅데이터 분석 서비스/머신러닝 2021. 9. 12. 01:01

머신러닝_보스턴 주택 값 예측(L1 Lasso, L2 Ridge)

4개월을 꽉 채웠다. 개강 초기에는 시간이 지나면 이 분야에 대해 자신감이 생길 줄 알았는데, 배울 수록 더 자신이 없어진다. 호호.. 앞으로 남은 2개월동안 더 열심히 해야겠다. 요즘은 머신러닝과 딥러닝을 거의 하루종일(?) 배우고 있는데, 물음표가 백만개는 떠다닌다. 뼛속부터 문과인 나에게 아주 큰 도전이다. 하루종일 뭔소린지 진짜 모르겠고요..? 아무튼 오늘 복습해볼 내용은 '보스턴 주택 값 예측' 이다. 두둥! import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_boston # 보스턴 주택값 데이터 일단 필요한 툴들을 가져오고, data = load_boston(..

빅데이터 분석 서비스/머신러닝 2021. 9. 12. 00:20

머신러닝_버섯 데이터 분류 실습(Decision Tree)

4번째 실습 버섯 데이터 분류. Decision Tree 알고리즘을 활용하여 진행하였고, 처음 접하는 알고리즘이다보니 트리의 최대 깊이, 노드의 최대 개수, 가지치기, 데이터 포인트 최소 개수 등 헷갈리는 개념이 많았다. 그래도 자주 접하다 보면 익숙해질 것이므로 크게 상심하지 말자! Decision Tree(결정트리)란? Tree를 만들기 위해 예/아니오 질문을 반복하며 학습 다양한 앙상블 모델이 존재 분류와 회귀에 모두 사용가능 타깃 값이 한개인 리프 노드를 순수노드라고 한다. 모든 노드가 순수 노드가 될때 까지 학습하면 복잡해지고 과대적합이 된다. 새로운 데이터 포인트가 들어오면 해당하는 노드를 찾아 분류라면 더 많은 클래스를 선택하고, 회귀라면 평균을 구한다. Decision Tree(결정트리) ..

빅데이터 분석 서비스/머신러닝 2021. 9. 4. 23:20

머신러닝_iris 품종 분류 실습(K-Nearest Neighbors)

머신러닝 5가지 실습을 마치고, 대략 2주동안 캐글 대회를 진행 중이다. 전자 상거래 물품 배송 예측(분류)을 주제로 진행하고 있는데, 종료되면 이에 대한 후기도 올릴 예정이다. 지금 심정은 굉장히.. 암울.. 멘붕..정도랄까.. 알파벳을 배우자마자 영어 작문을 하는 기분이다. 그래도 열심히 해봐야지.. 1.목표 - 붓꽃의 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비 특징을 활용해 3가지 품종을 분류해보자 import pandas as pd import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier # 하이퍼파라미터 from sklearn import metrics # 예측률 K-Nearest Neighbor..

빅데이터 분석 서비스/머신러닝 2021. 9. 4. 01:06

머신러닝_BMI(체질량지수) 실습(K-Nearest Neighbors)

머신러닝 2번째 실습인 bmi 체질량지수를 통한 실습. 막연하게 머신러닝을 생각했을 땐, 어떻게 학습을 시켜서 어떻게 예측하게 만드나 궁금했는데, 생각보다 간단하게 진행되었다. 바로 7:3으로 나눠서 7을 학습시키고 3을 예측하게 시키는 것! 이번 실습은 500명의 키와 몸무게를 통해서 진행했는데, 앞으로 규모가 더 커지면 500명은 아무것도 아닐 거라는 생각이 들었다. 01. 목표 (문제 정의) - 500명의 키와 몸무게, 비만도 라벨을 이용해 비만을 판단하는 모델을 만들어보자. import pandas as pd import matplotlib.pyplot as plt 02. 데이터 수집 - bmi500.csv 파일 형식의 데이터 파일 가져오기 data = pd.read_csv('data/bmi_50..

빅데이터 분석 서비스/머신러닝 2021. 8. 29. 15:37

머신러닝_서울시 구별 CCTV 현황 분석

1차 프로젝트가 끝난 후 본격적으로 머신러닝을 배우고 있다. 실습 위주로 진행 중인데, 실습 내용을 복습할 겸 정리하면 좋을 것 같아서 하나하나 정리하면서 올려볼 예정이다. 오늘 복습해볼 내용은 서울시 구별 CCTV 현황 분석인데, 복습을 하다보니, 복습이 아니라 새롭게 공부하는 느낌이 들 정도로 유익하다는 생각이 들었다. 그만큼 수업 시간에 놓치는 게 많다는 점ㅠㅠ 하루에 8시간씩 계속 집중하면서 수업듣는 일이 얼마나 어려운지 실감하고 있다. 수료할 때까지 열심히 배워봐야 겠다. 서울시 구별 CCTV 현황 분석하기 - pandas, matplotlib 사용하기 - 서울시 각 구별 CCTV 현황 살펴보기 - 인구대비 CCTV 비율이 높거나 낮은 지역 알아보기 - 각 구별 CCTV 예측치 확인하고 그로부터..

빅데이터 분석 서비스/머신러닝 2021. 8. 29. 14:54

Crawling_웹 크롤링이란?

우리는 정보의 홍수 속에 살고 있다. 인터넷만 접속하면 이 무궁무진한 정보들과 만날 수 있다. 하지만 사람의 능력은 한계가 있기 때문에 이러한 가공되지 않은 정보들 속에서 의미있는 정보를 찾는 것은 많은 시간과 노력이 필요하다. 1. 크롤링이란? 크롤링은 이러한 정보를 찾는 과정에서 효자 역할을 한다. 정확히 말하자면 데이터를 검색하여 필요한 정보를 색인하는 것을 말하는데, 사용자가 키워드를 하나하나 검색하여 정보를 얻고 저장하는 과정을 대신해준다고 보면 된다. 2. 크롤링은 어떤 툴을 사용하나요? 크롤링을 할 때 가장 많이 사용하는 언어는 바로 '파이썬'이다. 문법이 간결하고 라이브러리를 통해 여러 소스코드를 쉽게 불러올 수 있기 때문에 빠르게 개발이 가능하다. 웹 페이지에 접속한 후, F12를 누르면..

빅데이터 분석 서비스/Crawling 2021. 7. 11. 10:27

Python_딕셔너리

딕셔너리란? key와 value의 대응관계로 구성되어 있는 '연관 배열' 자료형으로, 리스트나 튜플처럼 순차적으로 요구값들을 구하지 않고, key를 통해 value를 얻는다. * 딕셔너리 생성 dic1={'name':'로또', 'age':'20', 'phone':'000-0000-0000'} 위에서 key는 각각 name, age, phone이고, value는 로또, 20, 000-0000-0000 이다. * 딕셔너리 값 가져오기 print(dic1['name']) print(dic1['age']) print(dic1['phone']) print(dic1.get('name')) print(dic1.get('age')) print(dic1.get('phone')) * 딕셔너리 값 추가 dic1['heigh..

빅데이터 분석 서비스/Python 2021. 6. 17. 22:41

Prev 1 2 Next

목록빅데이터 분석 서비스 (12)

멀리 보는 연습

티스토리툴바