Aprendizado de máquina com Scikit-Learn

Construa e avalie modelos simples de ML em Python

Aprenda a construir e avaliar modelos simples de aprendizado de máquina usando o Scikit-Learn em Python. Este tutorial fornece exemplos práticos e técnicas para treinamento, previsão e avaliação de modelos, tudo dentro de um fluxo de trabalho de ciência de dados.

Programação
Autor
Afiliação
Data de Publicação

7 de fevereiro de 2024

Data de Modificação

29 de abril de 2025

Palavras-chave

Tutorial do Scikit-learn, Aprendizado de máquina em Python, Construir modelo ML, Avaliação de modelos scikit-learn, Python ML

Introdução

O Scikit‑Learn é uma das bibliotecas mais populares do Python para aprendizado de máquina, oferecendo uma ampla gama de ferramentas para mineração de dados, análise de dados e construção de modelos. Neste tutorial, mostraremos como construir e avaliar modelos simples de aprendizado de máquina usando Scikit‑Learn. Se você é novo em aprendizado de máquina ou deseja atualizar suas habilidades, este guia o ajudará a entender o processo de treinamento, previsão e avaliação de modelos, tudo dentro de um fluxo de trabalho de ciência de dados.



Construção de um modelo simples de aprendizado de máquina

Uma das tarefas fundamentais do aprendizado de máquina é criar um modelo que possa aprender com os dados e fazer previsões. Nesta seção, vamos percorrer as etapas envolvidas na construção de um modelo de regressão linear simples.

Exemplo: regressão linear

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Crie um conjunto de dados sintético
np.random.seed(42)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X.flatten() + np.random.randn(100)

# Divida os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Instanciar e treinar o modelo de regressão linear
model = LinearRegression()
model.fit(X_train, y_train)

# Faça previsões no conjunto de testes
y_pred = model.predict(X_test)

# Avalie o modelo usando o erro quadrático médio (MSE)
mse = mean_squared_error(y_test, y_pred)
print("Mean Squared Error:", mse)
Mean Squared Error: 0.6536995137170021

Este exemplo demonstra como criar um conjunto de dados sintéticos, treinar um modelo de regressão linear e avaliar seu desempenho usando a métrica de erro quadrático médio.

Avaliando seu modelo

Depois que seu modelo estiver construído, é fundamental avaliar seu desempenho para garantir que ele se generalize bem para novos dados. As principais etapas de avaliação incluem:

  • Divisão de dados:
    Use técnicas como divisão de treinamento/teste ou validação cruzada para particionar seu conjunto de dados.

  • Métricas de desempenho:
    Dependendo do tipo de modelo, use métricas apropriadas, como precisão, exatidão, recall para classificação ou erro quadrático médio, R² para regressão.

  • Validação:
    Valide as previsões do seu modelo em dados não vistos para avaliar sua eficácia.

Conclusão

A construção de modelos de aprendizado de máquina com o Scikit-Learn é um processo simples, mas poderoso. Seguindo as etapas descritas neste tutorial — preparação de dados, treinamento de modelos, previsão e avaliação —, você pode criar modelos que extraem insights valiosos dos seus dados. Experimente diferentes algoritmos e métricas de avaliação para refinar ainda mais seus modelos.

Leitura adicional

Boa programação e divirta-se criando seus modelos de aprendizado de máquina com Scikit‑Learn!

Explore mais artigos

Nota

Aqui estão mais artigos da mesma categoria para ajudá-lo a se aprofundar no tópico.

placeholder

placeholder
Nenhum item correspondente
De volta ao topo

Reuso

Citação

BibTeX
@online{kassambara2024,
  author = {Kassambara, Alboukadel},
  title = {Aprendizado de máquina com Scikit-Learn},
  date = {2024-02-07},
  url = {https://www.datanovia.com/pt/learn/programming/python/data-science/machine-learning-with-scikit-learn.html},
  langid = {pt}
}
Por favor, cite este trabalho como:
Kassambara, Alboukadel. 2024. “Aprendizado de máquina com Scikit-Learn.” February 7, 2024. https://www.datanovia.com/pt/learn/programming/python/data-science/machine-learning-with-scikit-learn.html.