반응형
머신러닝
대표적인 라이브러리 : 사이킷 런 scikit-learn
딥러닝
인공신경망을 기반으로 한 방법들을 통칭 딥러닝
텐서플로 , 파이토치 라이브러리
마켓과 머신러닝
머신러닝에서 여러개의 종류 중 하나를 구별해 내는 문제를 분류라고 부른다.
2개의 클래스중 하나를 고르는 문제를 이진분류라고 한다.
생선의 길이, 무게와 같은 특징을 특성(feature)이라고 부른다.
길이를 x축으로하고 무게를 y축으로 정해서 그래프에 점으로 표시하는 것은 산점도라고 부른다.
산점도
파이썬에서 과학계산용 그래프를 그리는 대표적인 패키지는 맷플롯립 matplotlib이다.
산점도를 그리는 함수는 scatter( )
산점도 그래프가 일직선에 가까운 형태로 나타나는 경우를 선형(linear)적이라고 말한다.
맷플롯립에서 2개의 산점도를 한 그래프로 그리는 것은 scatter( ) 함수를 연달아 사용하면 된다.
k-최근접 이웃 알고리즘
zip( ) 함수와 for문을 사용.
from sklearn.neighbors import KNeighborsClassifier
kn=KNeighborsClassifier()
- KNeighborsClassifier 클래스의 객체를 먼저 만든다.
- data와 target을 전달하여 기준을 학습시킨다. (모델에 데이터를 전달하여 규칙을 학습하는 과정을 훈련이라고함)
- kn.fit(fish_data, fish_target)
- kn.score(fish_data, fish_target)
fit() 메서드는 주어진 데이터로 알고리즘을 훈련.
score() 메서드는 모델을 평가하는 메서드. → 0~1사이의 값을 반환한다.
정확도(accuracy)를 score로 가늠이 가능하다.
- k최근접이웃 알고리즘은 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 답으로
- → 즉, 주위의 데이터로 현재 데이터를 판단한다.
- kn.predict([[30,600]])
predict 메서드는 새로운 데이터의 정답을 예측. fit( )메서드와 마찬가지로 리스트의 리스트를 전달해야한다.
KNeighborsClassfier 클래스의 기본 값은 5이지만 n_neighbors 매개변수로 바꿀 수 있다.
kn49 = KNeighborsClassifier(n_neighbors=49)
문제
- 데이터를 표현하는 하나의 성질, 국가 데이터의 경우 인구 수, GDP, 면적 등이 하나의 국가를 나타낸다 머신러닝에서 이런 성질을 무엇이라고하는가?
- ⇒ 특성
- 가장 가까운 이웃을 참고하여 정답을 예측하는 알고리즘이 구현된 사이킷런 클래스는 무엇인가?
- ⇒KNeighborsClassifier k 최근접이웃
- 사이킷런 모델을 훈련할 때 사용하는 메서드는?
- ⇒ fit()
반응형