Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información

José Antonio Moreiro González

Resumen


Reflexión sintética para revisar las propuestas más relevantes que, siguiendo la teoría matemática de la comunicación de Shannon y Weaver, hayan afectado a los procedimientos del análisis automático del contenido documental. Partiendo del empleo de la teoría matemática en Ciencia de la Información se explican sus aplicaciones metodológicas en nuestra especialidad, en especial respecto a las técnicas de recuperación de la información. Para después describir los modelos matemáticos aplicados al análisis automático del contenido: leyes de Zipf y
Goffman, antidiccionarios para índices permutados, Indización Estadística de Términos por Frecuencias, algoritmos n-grams y de stemming, así como los referidos a los métodos de agrupación y clasificación como clusters por valor de discriminación y por relevancia de los términos como son los métodos de agrupación basados en Grafos Teóricos, los basados en Centros de masas, el algoritmo K-vecinos o Kmedias,
el K-vecinos axial o incremental, y el algoritmo ISODATA. Para luego exponer los clasificadores cienciométricos como el método de Chen y finalmente los métodos con sistemas de aprendizaje

Palabras clave


análisis de contenido textual; análisis automático; elementos matemáticos; métodos estadísticos; métodos probabilísticos; redes neuronales; coocurrencias; métodos basados en centroides; clustering; textual content analysis; automatic analysis; st

Texto completo

PDF

Enlaces refback

  • No hay ningún enlace refback.


Copyright (c) 2017 Anales de Documentación

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento 4.0 Internacional.

Anales de Documentación está indizada en las bases de datos internacionales , Web of Science, SCOPUS, LISA, LISTA, ERIH PLUS, Latindex-Catálogo, Latindex-Directorio, DOAJ, en la base de datos española ISOC, en los repositorios E-LIS, Redalyc, Recyt; en la plataforma REDIB.