전체 글(6)
-
[혼공학습단10기] 혼자 공부하는 머신러닝+딥러닝 5주차 ch_6 비지도 학습
06-1 군집 알고리즘 비지도 학습 - unsupervised learning - 타깃이 없을 때 사용하는 머신러닝 알고리즘 - 사람이 가르쳐 주지 않아도 데이터에 있는 무언가를 학습 군집 - clustering - 비슷한 샘플끼리 그룹으로 모으는 작업 클러스터 - cluster - 군집알고리즘에서 만든 그룹 06-2 k-평균 k-means 군집 알고리즘 - 평균값을 자동으로 찾아준다. - 평균값이 클러스터의 중심에 위치하기 때문에 cluster center 또는 centroid라고 부른다. k-means 알고리즘 작동방식 (기본 미션) 1. 무작위로 k개의 클러스터 중심을 정한다. 2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다. 3. 클러스터에 속한 샘플의 평균값으..
2023.08.11 -
[혼공학습단10기] 혼자 공부하는 머신러닝+딥러닝 4주차 Ch_5 트리알고리즘
05-1 결정트리 ( Decision Tree ) 로지스틱 회귀 - 설명하기 어렵다. - 모델이 왜 저런 계수값으로 학습했는지 정확히 알 수가 없다. 결정트리 - 질문을 하나씩 던져서 정답과 맞춰간다. -> 스무고개와 같다. - 데이터를 잘 나눌 수 있는 질문을 찾으면 분류 정확도를 높일 수 있다. 노드 - 결정 트리를 구성하는 핵심 요소 - 훈련 데이터의 특성에 대한 테스트를 표현 - 가지(Branch)는 테스트의 결과 (True, False )를 나타낸다. - 일반적으로 하나의 노드는 2개의 가지를 가진다. -> 루트 노드( root node ) : 맨위의 노드 -> 리프 노드( leaf node ) : 맨 아래 끝에 달린 노드 노드 해석 - 테스트 조건 - 분순도 - 총 샘플 수 - 클래스별 샘플 ..
2023.07.29 -
[혼공학습단10기] 혼자 공부하는 머신러닝 + 딥러닝 3주차 Ch_4 다양한 분류 알고리즘
04-1 로지스틱 회귀 k-최근접 이웃 분류기 데이터 준비하기 k-최근접 이웃 분류기의 확률 예측 다중 분류 - multi class classification - 타깃 데이터에 2개 이상의 클래스가 포함된 문제 5개 샘플의 예측 결과 5개중 4번째 샘플 결과 분석 k-최근접 이웃의 한계 - 가능한 확률값이 정해져 있다. -> k=3인경우, 0/3, 1/3, 2/3, 3/3만 가능 로지스틱 회귀 - logistic regression - z = a x (Weight) + b x (Length) + c x (Diagonal) + d x (Height) + e x (Width) + f - 확률값은 0 ~ 1의 값을 가진다. - z가 큰 음수일 때 0 z가 큰 양수일 때 1 -> 시그모이드 함수(sigmoid..
2023.07.22 -
[혼공학습단 10기] 혼자 공부하는 머시러닝 + 딥러닝 2주차 Ch_3 회귀 알고리즘과 모델 규제
03-1 k-최근접 이웃 회귀 k-최근접 이웃 회귀 지도 학습 알고리즘 회귀(regression) : 임의의 숫자를 예측 분류(classification) : 샘플을 몇 개의 클래스 중 하나로 분류 k-최근접 이웃 알고리즘 분류 : 1. 예측하려는 샘플에 가장 가까운 샘플 k개 선택 2. 이 샘플들의 클래스중 다수 클래스를 새로운 샘플의 클래스로 예측 회귀 : 1. 예측하려는 샘플에 가장 가까운 샘플 k개를 선택 2. 샘플 k개의 평균값을 계산 실습 데이터 준비하기 결정계수(R^2) 결정계수 ( coefficient of determination ) - 결정계수가 0에 가까운 값 예측한 값이 타깃의 평균 정도를 예측하는 수준 - 결정계수가 1에 가까운 값 예측한 값이 타깃과 가까운 값을 예측 실습 훈련,..
2023.07.15 -
[혼공학습단 10기] 혼자 공부하는 머신러닝 + 딥러닝 1주차 Ch_2 데이터 다루기
02-1 훈련 세트와 테스트 세트 지도 학습과 비지도 학습 지도 학습(supervised learning) - 알고리즘이 정답을 맞히는 것을 학습 - 훈련 데이터(training data) = 입력(input) + 정답(target) - 입력(input) : 데이터, ex) 길이와 무게 ( feature) - 타깃(target) : 정답, ex) 도미, 빙어 비지도 학습(unsupervised learning) - 입력데이터만 사용 = 타깃이 없다. - 정답을 사용하지 않으므로 정답을 맞출 수 없다. - 데이터를 파악하거나 변형하는데 사용 훈련 세트와 데스트 세트 - 훈련에 사용하는 훈련데이터와 테스트에 사용하는 테스트 데이터가 달라야 한다. - 훈련에 사용한 데이터를 테스트에 사용하면 정답을 알고 시험..
2023.07.08 -
[혼공학습단 10기] 혼자 공부하는 머신러닝 + 딥러닝 1주차 - Ch_1 나의 첫 머신러닝
01-1 인공지능과 머신러닝, 딥러닝 인공지능 - 사람처럼 학습하고 추론한 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술 - 인공지능 구분 강인공지능(String AI) = 인공일반지능(Artificial General Intelligence) 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템ex) 터미네이터의 스카이 약인공지능(Weak AI) 특정 분야에서 사람의 일을 도와주는 보조 역활ex) 음성 비서, 자율 주행 자동차, 음악 추천, 기계 변역 머신러닝 - 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야 - 통계학에서 유래된 머신러닝 알고리즘이 많다. - 사이킷런(scikit-learn) 파이썬 API를 사용하여 배우기 쉽고, 컴파일하지 않아도 되기 때문에 사용이 편리 모든 머신러닝..
2023.07.07