
scikit-learn是一个用于机器学习的Python库,提供了包括分类、回归、聚类和降维等常见任务的丰富工具。下面是一些scikit-learn的基本用法示例:
导入所需模块和数据集:
from sklearn import datasets
from sklearn.model_selection import train_test_split
# 加载数据集
iris = datasets.load_iris()
X = iris.data # 特征向量
y = iris.target # 目标变量
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
创建模型和训练:
from sklearn.linear_model import LogisticRegression
# 创建逻辑回归模型
model = LogisticRegression()
# 拟合(训练)模型
model.fit(X_train, y_train)
预测和评估:
from sklearn.metrics import accuracy_score
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
以上是使用scikit-learn进行简单机器学习任务的基本流程。你还可以使用其他模型、调整参数、进行特征工程等来提高模型性能。scikit-learn提供了丰富的功能和工具,可根据不同任务的需求灵活使用。详细文档和示例可以在scikit-learn的官方网站上找到。