Reduccion de la Dimensionalidad Machine Learning

La reduccion de dimensiones en un dataset se aplica para ver intuitivamente como se comporta los datos , y tambien se aplica en cualquier ciclo del proyecto: parte de exploracion, modelado , tunning del algortimo de machine learning.

Datos que podrian Interesarle para comprender mejor:

Dale click a las imagenes para ver su informacion

Diferencia entre Reduccion de la Dimensionalidad y el Lema de Johnson Lindenstrauss

El Lema de Johnson Lindenstrauss existian puntos de mayor dimension del dataset a una menor dimensionalidad, con la propiedad que la distancia entre los puntos nuevos F(u) y F(v) eran aproximadamente similares a las distancia de los puntos originales u y v , co una cota de error, el metodo de Mnist es decir la Reduccion de la dimensionalidad no va a cumplir con este lema, van a priorizar las distancias cercanas pero no las lejanas, es decir, vamos a ver similiaridad cuando los datos esten cerca, y cuando este lejos vamos a saber que solo esta lejos.

El porque de la Reduccion de Dimensiones en un dataset

Visualizacion en Mnist:

1) Permite ejemplo, reducir de 5 a 2 dos dimensiones .

2)Tambien podemos ver como se comporta los datos en n dimensiones.

3) Nos permite buscar agrupamiento( al reducir vemos datos que estan cerca entre si pero tambien alejados del resto ), y relacione con variables categoricas

Reducir tiempo de computo en Mnist:

Hay algunos algoritmos que no escala muy bien con la cantidad de dimensiones del dataset, mejorar la performance reduciendo la cantidad de dimensiones, con la menor cantidad, sin afectar la performance o la precision del algoritmo resultable.

Obtener los features importantes de los Dataset en Mnist:

Al reducir podemos ver la escencia del dataset, tal vez el problema tenga menor cantidad de dimensiones.Aca aparece el Teorema de Manifold + Manifold learning, que dice las dimensiones reales de los datos no son generalmente a las dimensiones aparentes.

Ejemplos:

Reduccion de dimensiones en Machine learning de una curva en dos deminesiones a una recta en una dimension
Podemos hacer Reduccion de dimensiones en Machine learning de una curva en dos dimensiones a una recta en una dimension:

En este dataset tiene una relacion entre x e y, con una dimension aparente de dos dimensiones, es una curva, pero si la parametrizacmos en una sola variable, la dimension real del dataset sera 1, pero ojo respetas las restricciones de la curva y(x)=valor de la curva en su traspaso a la recta.

Como reducir imagenes de una foto, videos, pdf ?

Aca tenemos una imagen, y esta imagen la podemos pensar como una matriz de n*n , vemos que la dimensiondad del dataset real son la forma, el ancho del de los ojos, los datos aparentes serian la cantidad de pixeles, ya que la forma( ancho ,color, ect) es igual en 1000*1000 pixeles que en 120px *180px entonces las dimensiones reales son las mismas.Asi es como se reducen la dimensionalidad en python ect.

Como reducir las dimensiones de una foto sin perder calidad?

Al reducir la dimensionalidad de los datos, en este caso una foto, vamos a perder calidad si o si, pero si la reduccion de dimensionalidad no es muy grande, es posible que el ojo humano no vea esos cambios.Pero si nos pasamos , pasara lo que paso con la imagen del ojo.

Tipos de Reduccion de Dimensiones en Machine Learning

Segun el metodo , o tipo de algoritmo de machine learning de reduccion, tendra relaciones y patrones que agregaran significado o nos pueden llevar a una conclusion errorea!

Mnist Lineales:

En este listado podrás encontrar los tipos de algoritmos de reduccion de dimensiones lineales. Haz clic en el nombre de la foto o en su imagen para más información.

Los significados son SVD es Singular Value Descomposition , PCA significa Analisis de Componentes Principales, y MDS es Multidimensional Scaling.Estos algoritmos de Reduccion estan desarrolados en ejemplo: mnist keras , mnist tensorFlow ect.

Mnist No Lineales:

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *