Aprendizaje automático con Scikit-Learn

Crea y evalúa modelos simples de aprendizaje automático en Python

Aprenda a crear y evaluar modelos sencillos de aprendizaje automático con Scikit-Learn en Python. Este tutorial proporciona ejemplos prácticos y técnicas para el entrenamiento, la predicción y la evaluación de modelos, todo ello dentro de un flujo de trabajo de ciencia de datos.

Programación
Autor/a
Afiliación
Fecha de publicación

7 de febrero de 2024

Fecha de modificación

9 de mayo de 2025

Palabras clave

Tutorial de Scikit-learn, Aprendizaje automático en Python, Crear un modelo ML, Evaluación de modelos scikit-learn, Python ML

Introducción

Scikit‑Learn es una de las bibliotecas más populares de Python para el aprendizaje automático, que ofrece una amplia gama de herramientas para la minería de datos, el análisis de datos y la creación de modelos. En este tutorial, le mostraremos cómo crear y evaluar modelos sencillos de aprendizaje automático utilizando Scikit‑Learn. Tanto si es nuevo en el aprendizaje automático como si desea actualizar sus habilidades, esta guía le ayudará a comprender el proceso de entrenamiento, predicción y evaluación de modelos, todo ello dentro de un flujo de trabajo de ciencia de datos.



Creación de un modelo sencillo de aprendizaje automático

Una de las tareas fundamentales del aprendizaje automático es crear un modelo que pueda aprender de los datos y hacer predicciones. En esta sección, veremos los pasos necesarios para crear un modelo de regresión lineal sencillo.

Ejemplo: Regresión lineal

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Crear un conjunto de datos sintéticos
np.random.seed(42)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X.flatten() + np.random.randn(100)

# Divide los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Instancia y entrena el modelo de regresión lineal
model = LinearRegression()
model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Evalúa el modelo utilizando el error cuadrático medio (MSE)
mse = mean_squared_error(y_test, y_pred)
print("Mean Squared Error:", mse)
Mean Squared Error: 0.6536995137170021

Este ejemplo muestra cómo crear un conjunto de datos sintéticos, entrenar un modelo de regresión lineal y evaluar su rendimiento utilizando la métrica de error cuadrático medio.

Evaluar el modelo

Una vez creado el modelo, es fundamental evaluar su rendimiento para garantizar que se generaliza bien a nuevos datos. Los pasos clave de la evaluación incluyen:

  • División de datos:
    Utilice técnicas como la división de entrenamiento/prueba o la validación cruzada para dividir su conjunto de datos.

  • Métricas de rendimiento:
    Dependiendo del tipo de modelo, utilice métricas adecuadas, como la exactitud, la precisión, la recuperación para la clasificación o el error cuadrático medio, R² para la regresión.

  • Validación:
    Valide las predicciones de su modelo con datos desconocidos para evaluar su eficacia.

Conclusión

La creación de modelos de aprendizaje automático con Scikit-Learn es un proceso sencillo pero potente. Siguiendo los pasos descritos en este tutorial (preparación de datos, entrenamiento de modelos, predicción y evaluación), podrá crear modelos que extraigan información valiosa de sus datos. Experimente con diferentes algoritmos y métricas de evaluación para perfeccionar aún más sus modelos.

Lecturas adicionales

Feliz programación y disfrute creando sus modelos de aprendizaje automático con Scikit‑Learn!

Explorar más artículos

Nota

Aquí hay más artículos de la misma categoría para ayudarte a profundizar en el tema.

placeholder

placeholder
No hay resultados
Volver arriba

Reutilización

Cómo citar

BibTeX
@online{kassambara2024,
  author = {Kassambara, Alboukadel},
  title = {Aprendizaje automático con Scikit-Learn},
  date = {2024-02-07},
  url = {https://www.datanovia.com/es/learn/programming/python/data-science/machine-learning-with-scikit-learn.html},
  langid = {es}
}
Por favor, cita este trabajo como:
Kassambara, Alboukadel. 2024. “Aprendizaje automático con Scikit-Learn.” February 7, 2024. https://www.datanovia.com/es/learn/programming/python/data-science/machine-learning-with-scikit-learn.html.