scikit-learn的基本用法

scikit-learn的基本用法

scikit-learn是一个用于机器学习的Python库,提供了包括分类、回归、聚类和降维等常见任务的丰富工具。下面是一些scikit-learn的基本用法示例:

  1. 导入所需模块和数据集:

from sklearn import datasets

from sklearn.model_selection import train_test_split


# 加载数据集

iris = datasets.load_iris()

X = iris.data  # 特征向量

y = iris.target  # 目标变量


# 划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

  1. 创建模型和训练:

from sklearn.linear_model import LogisticRegression


# 创建逻辑回归模型

model = LogisticRegression()


# 拟合(训练)模型

model.fit(X_train, y_train)

  1. 预测和评估:

from sklearn.metrics import accuracy_score


# 预测测试集

y_pred = model.predict(X_test)


# 计算准确率

accuracy = accuracy_score(y_test, y_pred)

print("Accuracy:", accuracy)

以上是使用scikit-learn进行简单机器学习任务的基本流程。你还可以使用其他模型、调整参数、进行特征工程等来提高模型性能。scikit-learn提供了丰富的功能和工具,可根据不同任务的需求灵活使用。详细文档和示例可以在scikit-learn的官方网站上找到。