생각/인공지능

붓꽃 데이터셋(Iris dataset) 분류 모델

kyunghoonk00k 2023. 7. 2. 16:39
반응형

이 예시에서는 붓꽃 데이터셋(Iris dataset)을 사용하여 분류 모델을 만들어 보겠습니다. 이 데이터셋은 세 가지 종류의 붓꽃(Iris Setosa, Iris Versicolor, Iris Virginica)의 꽃잎과 꽃받침의 너비와 길이를 측정한 데이터입니다. 이 모델은 꽃잎과 꽃받침의 크기를 바탕으로 붓꽃의 종류를 분류하는 문제를 해결합니다. 

먼저, 필요한 라이브러리를 설치하고 불러옵니다.

python
import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report, confusion_matrix

붓꽃 데이터셋을 로드합니다.

python
iris = datasets.load_iris()
X = iris.data
y = iris.target

데이터셋을 학습셋과 테스트셋으로 나눕니다. 이 예시에서는 학습셋 80%, 테스트셋 20%의 비율로 나눕니다.

python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

K-최근접 이웃(K-Nearest Neighbors, KNN) 알고리즘을 사용하여 분류 모델을 만듭니다. 이 예시에서는 K를 3으로 설정합니다.

python
# KNN 모델 생성
model = KNeighborsClassifier(n_neighbors=3)

# 모델 학습
model.fit(X_train, y_train)

테스트 데이터에 대해 분류를 수행하고, 모델의 성능을 평가합니다.

python
# 예측 수행
y_pred = model.predict(X_test)

# 성능 평가
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

이렇게 간단한 예시 코드를 통해 분류 모델을 구축하고 평가할 수 있습니다.

반응형

'생각 > 인공지능' 카테고리의 다른 글

AI 지도 학습 이론  (0) 2023.07.02
딥러닝이란?  (0) 2023.06.29
머신 러닝  (0) 2023.06.25
mojo vs python  (0) 2023.06.14
[인공지능 시스템 2강]  (1) 2022.09.22