-
Teorema de Bayes
El artículo de Thomas Bayes se publica póstumamente con respecto a un teorema para relacionar la probabilidad actual con la probabilidad previa llamada el teorema de Bayes. Es fundamental para la obtención de datos y la probabilidad, ya que permite la comprensión de realidades complejas basadas en probabilidades estimadas. -
La regresión para determinar las órbitas de los cuerpos sobre el sol
Adrien-Marie Legendre y Carl Friedrich Gauss aplican la regresión para determinar las órbitas de los cuerpos sobre el Sol (cometas y planetas). El objetivo del análisis de regresión es estimar las relaciones entre variables, y el método específico que utilizaron en este caso es el método de mínimos cuadrados. La regresión es una de las herramientas clave en la minería de datos. -
Comienzo de la era informatica
Este es el comienzo de la era de la informática que hace posible la recopilación y el procesamiento de grandes cantidades de datos. En un artículo de 1936, sobre números computables, Alan Turing introdujo la idea de una máquina universal capaz de realizar cálculos como nuestras computadoras modernas. La computadora moderna se basa en los conceptos iniciados por Turing. -
Primer modelo conceptual de una red neuronal
Warren McCulloch y Walter Pitts fueron los primeros en crear un modelo conceptual de una red neuronal. En un trabajo titulado Un cálculo lógico de las ideas inmanentes a la actividad nerviosa, describen la idea de una neurona en una red. Cada una de estas neuronas puede hacer 3 cosas: recibir entradas, procesar entradas y generar salidas. -
Decision Science
Lawrence J. Fogel formó una nueva compañía llamada Decision Science, Inc. para aplicaciones de programación evolutiva. Fue la primera compañía que aplica específicamente la computación evolutiva para resolver problemas del mundo real. -
Sofisticados sistemas de administración de bases de datos
Con sofisticados sistemas de administración de bases de datos, es posible almacenar y consultar terabytes y petabytes de datos. Además, los almacenes de datos permiten a los usuarios pasar de una forma de pensar orientada a las transacciones a una forma más analítica de ver los datos. Sin embargo, la extracción de información sofisticada de estos almacenes de datos de modelos multidimensionales es muy limitada. -
Publicación del libro "Adaptación en sistemas naturales y artificiales"
John Henry Holland escribió Adaptación en sistemas naturales y artificiales, el libro innovador sobre algoritmos genéticos. Es el libro que inició este campo de estudio, presentando los fundamentos teóricos y explorando aplicaciones -
HNC marca la frase "minería de bases de datos".
HNC marca la frase "minería de bases de datos". La marca estaba destinada a proteger un producto llamado DataBase Mining Workstation. Era una herramienta de propósito general para construir modelos de redes neuronales y ahora ya no está disponible. También es durante este período que los algoritmos sofisticados pueden "aprender" relaciones a partir de datos que permiten a los expertos en la materia razonar sobre lo que significan las relaciones. -
"Descubrimiento de conocimientos en bases de datos"
El término "Descubrimiento de conocimiento en bases de datos" (KDD) es acuñado por Gregory Piatetsky-Shapiro. También en este momento cofunda el primer taller también llamado KDD. -
Aparición del termino "Minería de datos" en B.D.
El término "minería de datos" apareció en la comunidad de la base de datos. Las empresas minoristas y la comunidad financiera están utilizando la minería de datos para analizar datos y reconocer las tendencias para aumentar su base de clientes, predecir las fluctuaciones en las tasas de interés, los precios de las acciones y la demanda de los clientes. -
Maquina de vectores de soporte
Bernhard E. Boser, Isabelle M. Guyon y Vladimir N. Vapnik sugirieron una mejora en la máquina de vectores de soporte original que permite la creación de clasificadores no lineales. Las máquinas de vectores de soporte son un enfoque de aprendizaje supervisado que analiza los datos y reconoce los patrones utilizados para la clasificación y el análisis de regresión. -
KDnuggets
Gregory Piatetsky-Shapiro comienza el boletín Knowledge Discovery Nuggets (KDnuggets). Originalmente estaba destinado a conectar a los investigadores que asistieron al taller de KDD. Sin embargo, KDnuggets.com parece tener una audiencia mucho más amplia ahora. -
Introducción del término "Ciencia de datos" como un disciplina independiente.
Aunque el término ciencia de los datos ha existido desde la década de 1960, no fue hasta 2001 que William S. Cleveland lo introdujo como una disciplina independiente. Según Build Data Science Teams, DJ Patil y Jeff Hammerbacher utilizaron el término para describir sus roles en LinkedIn y Facebook. -
Minería de datos en el deporte
Moneyball, de Michael Lewis, se publica y cambia la forma en que muchas oficinas principales de las Grandes Ligas hacen negocios. Los Atléticos de Oakland utilizaron un enfoque estadístico basado en datos para seleccionar cualidades en los jugadores que estaban infravaloradas y eran más baratas de obtener. De esta manera, lograron reunir a un equipo que los llevó a los playoffs de 2002 y 2003 con 1/3 de la nómina. -
Minería de datos extendida
DJ Patil se convirtió en el primer científico jefe de datos en la Casa Blanca. Hoy en día, la minería de datos está muy extendida en los negocios, la ciencia, la ingeniería y la medicina, por nombrar solo algunos. La minería de las transacciones de tarjetas de crédito, los movimientos bursátiles, la seguridad nacional, la secuenciación del genoma y los ensayos clínicos son solo la punta del iceberg para las aplicaciones de minería de datos.