Tres ejemplos para "principiantes" usando Scikit-Learn, NumPy y SFrame.
Posted by Jordy Cuan on May 8, 20169 minute read
Ejemplo 1: Ejemplo básico con dataset de diabetes propio de scikit-learn
Este ejemplo es sencillo ya que no necesitamos más que scikit-learn únicamente para observar cómo funciona el algoritmo
Salidas
Plot 1: Dataset de diabetes y su modelo predictivo.
Yo no soy el autor del código anterior! lo puedes encontrar en la página de scikit-learn en sus ejemplos (aquí), sin embargo, aquí explico y detallo un poco poniendo comentarios con intención de ayudar a los que se les dificulta el inglés (no se debería de dificultar a los programadores pues la gran mayoría está en inglés).
Ejemplo 2: Cargando un dataset de diabetes en formato CSV a NumPy
Salidas
Plot 2: Dataset de diabetes remoto en formato CSV y modelo predictivo.
Y bueno Jordy ¿De dónde sacaste este código? Pues lo escribí yo mismo con algunas dificultades para quitar los valores nulos (ceros). Y sí, viendo algunos recursos en internet como el sagrado Stack Overflow. El dataset salió de aquí donde podemos encontrar más de estos para usarlos con fines de estudio.
Ejemplo 3: Procesando el dataset con SFrame. Predecir precio de una casa dado el área
Salidas
Plot 3: Dataset de casas usando SFrame.
¿Por qué SFrame si es análogo? Bueno, he de decir que me agrada la manera en la que presenta los datos de modo más amigable cuando mandamos a imprimir uno de estos objetos. También los programadores de este, dicen que la información no es cargada en memoria, entonces tenemos una pequeña ventaja si trabajamos con equipos de menor memoria RAM. Quizá me quede corto con mi explicación pero en los siguientes links podrás ver otras de las maravillas que se pueden hacer con este tipo de datos (SFrame y SArray).
Realmente espero que estos ejemplos les hayan ayudado. Ya les demostré cómo trabajar de diferentes formas con los datasets, lo siguiente serán los algoritmos.
¡Pero Jordy, ahora no explicaste la teoría y modelos matemáticos que hay detrás de esto! Cierto, necesitaré un poco de tiempo para escribir de modo legible el modelo matemático detrás de esto. Ya saben cuál será la próxima entrada.
Dudas / Comentarios
Si tienes alguna duda o comentario, escríbelo aquí o mandame un tweet a @JordyCRPetrucci y te ayudaré con gusto.