Charla de José A. Guerrero
El 9 de julio de 2015, José A. Guerrero dará una charla con título “Machine learning como nuevo deporte intelectual” y programa: Origen y situación actual de las competiciones de Análisis de Datos...
View ArticleTodos los errores son iguales, pero algunos son más iguales que otros
Por eso, en la práctica, el RMSE y similares son irrelevantes. Aunque eso, desgraciadamente, no quiera decir que no sean utilizados. Pero en muchas ocasiones no es el error medio la medida importante....
View ArticleNMF: una técnica mergente de análisis no supervisado
[N]NMF (se encuentra con una o dos enes) es una técnica de análisis no supervisado emergente. Se cuenta entre mis favoritas. [N]NMF significa non negative matrix factorization y, como SVD, descompone...
View ArticleDBSCAN, ¿algo nuevo bajo el sol?
Ha sido en latitudes otras que las habituales que he aprendido y leído (mas no probado) sobre DBSCAN. Se conoce que es un nuevo (aunque ya tiene sus añitos: algo así como 20) método de clústering. Por...
View ArticleMi otra debilidad: procesos de Poisson “autoexcitados”
La primera es la factorización positiva de matrices positivas. La otra, como bien titula la entrada, los procesos de Poisson autoexcitados. Por eso no podía dejar de traer a la atención de mis lectores...
View ArticleProyectos de fin de máster: ¿alguna sugerencia?
Doy clase en algunos máster de ciencia de datos. Estos máster suelen concluir con la realización de algún proyecto completo. Ya sabemos cómo funcionan estas cosas en el medio académico: se busca...
View ArticleValidación cruzada en R
Está de moda usar caret para estas cosas, pero yo estoy todavía acostumbrado a hacerlas a mano. Creo, además, que es poco instructivo ocultar estas cuestiones detrás de funciones de tipo...
View ArticleGBM sintetizado en una línea
Es Por supuesto, el lector se preguntará muchas cosas, entre las que destaco: ¿Qué representa cada uno de los elementos que aparecen en la línea anterior? ¿Qué parte de ella es solo casi siempre...
View Article¿Se puede explicar la predicción de un modelo de caja negra?
Imaginemos un banco que construye modelos para determinar si se concede o no un crédito. Este banco tiene varias opciones para crear el modelo. Sin embargo, en algunos países el regulador exige que el...
View ArticleCaret y rejillas: ¿es necesario utilizar fuerza bruta?
Durante la charla de Carlos Ortega del pasado jueves sobre el paquete caret y sus concomitancias, se planteó el asunto de la optimización de los parámetros de un modelo usando rejillas (grids) de...
View Articlek-medias es como las elecciones; k-vecinos, como los cumpleaños
El otro día asistí a la enésima confusión sobre k-medias y k-vecinos. Que lo es, más en general, sobre el clústering contra modelos locales de la clase que sean, desde k-vecinos hasta el filtrado...
View ArticleLa Consejería de Empleo de la Función General de la Comunidad Autónoma de...
Ese es el nombre agramatical de una nueva consejería pergeñada por una red neuronal recurrente que he ajustado usando un año de BOEs. El código, adaptado de aquí y sustancialmente mejorado, es...
View ArticleEl RMSE es Dios y XGBoost, su profeta
De los últimos foros de científicos de datos a los que he asistido, de las últimas conversaciones con científicos de datos que he mantenido, he salido con una gran duda: ¿soy yo el que tiende a...
View ArticleRecetas y principios
En algunas de las últimas charlas (de ML) a las que he asistido se han enumerado recetas con las que tratar de resolver distintos problemas. Pero no han explicado cuándo ni por qué es conveniente...
View ArticleEl principio de información
Tramontando el recetariado, llegamos a los principios. Y el más útil de todos ellos es el de la información (o cantidad de información). (Sí, de un tiempo a esta parte busco la palabra información por...
View ArticleHomeopatía de datos
Me mandan un whatsapp. Es de alguien que está en una charla de ciencia de datos. Acaba de oír decir al ponente que en una de esas competiciones de Kaggle le ha servido optimizar a lo largo del conjunto...
View ArticleUna fina, tenue, somera capa de sintaxis
Estuve el otro día en una charla de José Luis Cañadas en el grupo de usuarios de R de Madrid sobre sparklyr. Hoy en otra de Juan Luis Rivero sobre, esencialmente, lo mismo, pero esta vez con Python. Y...
View ArticleDiapositivas de “Antikaggle: contra la homeopatía de datos”
He colgado las diapositivas de Antikaggle: contra la homeopatía de datos. Sobre todo, para que aquellos que aún conserven la pasión por saber más puedan visitar los enlaces que recopilé y que figuran...
View ArticleUn párrafo afortunadísimo sobre las “nuevas aptitudes”
Traduzco: Las nuevas aptitudes que tanto atraen la atención de los medios no sirven para resolver más eficazmente el problema de la inferencia; son puras técnicas de supervivencia para gestionar los...
View Article
More Pages to Explore .....