Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información

  • José Antonio Moreiro González
Palabras clave: análisis de contenido textual, análisis automático, elementos matemáticos, métodos estadísticos, métodos probabilísticos, redes neuronales, coocurrencias, métodos basados en centroides, clustering, textual content analysis, automatic analysis, st

Resumen

Reflexión sintética para revisar las propuestas más relevantes que, siguiendo la teoría matemática de la comunicación de Shannon y Weaver, hayan afectado a los procedimientos del análisis automático del contenido documental. Partiendo del empleo de la teoría matemática en Ciencia de la Información se explican sus aplicaciones metodológicas en nuestra especialidad, en especial respecto a las técnicas de recuperación de la información. Para después describir los modelos matemáticos aplicados al análisis automático del contenido: leyes de Zipf y Goffman, antidiccionarios para índices permutados, Indización Estadística de Términos por Frecuencias, algoritmos n-grams y de stemming, así como los referidos a los métodos de agrupación y clasificación como clusters por valor de discriminación y por relevancia de los términos como son los métodos de agrupación basados en Grafos Teóricos, los basados en Centros de masas, el algoritmo K-vecinos o Kmedias, el K-vecinos axial o incremental, y el algoritmo ISODATA. Para luego exponer los clasificadores cienciométricos como el método de Chen y finalmente los métodos con sistemas de aprendizaje

Descargas

La descarga de datos todavía no está disponible.
Cómo citar
Moreiro González, J. A. (1). Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información. Anales De Documentación, 5, 273-286. Recuperado a partir de https://revistas.um.es/analesdoc/article/view/2101
Sección
Artículos

Artículos más leídos del mismo autor/a