A fines de los años ochenta del siglo pasado, los hermanos Thomas y John Knoll comenzaron a diseñar un programa de edición de fotografías e imágenes. Thomas era un estudiane de doctorado en visión por computadora en la universidad de Michigan y había escrito un programa para mostrar y modificar imágenes. Al verlo su hermano John que para ese entonces trabajaba en la infustria de los efectos visuales para películas lo encontró bastante bueno y útil. 

Buenas tardes. Les comparto a todos mi artículo sobre el traductor estadístico entre el wixárika y el español. Para una descripción más detallada los invitamos a ver el siguiente link.  Espero les guste. Si gustan ver un trabajo similar entre el español y el náhuatl, les invitamos a ver esta entrevista.

Introducción

En este trabajo daremos una introducción general a PostgreSQL, el sistema de manejo de bases de datos open source más avanzado del mundo. Este sistema soporta una increíble carga de trabajo, logra dar una estabilidad de consultas sin bloqueos, lo que aumenta su desempeño sobre todo con alta concurrencia y bases de datos grandes. También comenzaremos con algunas características básicas del sistema y ejemplos que nos permitirán acercarnos al desarrollo y administración del mismo.

Historia de PostgreSQL

Tiene su inicio en 1982 con un proyecto originario de la Universidad de Berkeley, llamado Ingres que fue iniciado y lidereado por Michael Stonebraker. Este primer proyecto fue generado desde la universidad pero fue distribuido incluso de manera comercial, convirtiéndose en uno de las primeras bases de datos relacionales. Sin embargo algunos creadores de esta base de datos decidieron volver a la universidad para iniciar un nuevo proyecto ,en base a la experiencia adquirida con Ingres. Este proyecto sería llamado Post-Ingres, o POSTGRES. En esta versión se logró incorporar tipos de datos y ciertas reglas que definían la los procesos internos para obtener información.

En esta ocasión exploraremos de una manera muy básica un algoritmo no supervisado de aprendisaje máquina. Queremos clasificar una serie de datos con la computadora, sin que tengamos algún entrenamiento previo. Cada dato se representa en forma de vectores y estos tendrán una distancia entre ellos. De tal manera que se encuentren agrupamientos. Este tipo de algoritmos son llamados de agrupamiento o de clustering. A su vez, como se ha dicho si contamos un conjunto de datos y queremos identificar relaciones entre ellos, sin tener conocimientos previos sobre ellos, entonces estamos hablando de aprendizaje máquina no supervisado.

El algoritmo que trataremos es uno de los más conocidos y es el agrupamiento jerárquico. Este algoritmo, con una métrica, comienza a detectar distancias entre los datos, agrupando a los datos más cercanos en grupos. Una vez encontrados los primeros grupos, estos se toman como unidades, buscando nuevamente vecinos cercanos. 

Share This