TY - JOUR AU - Moreiro González, José Antonio PY - 2002/01/01 Y2 - 2024/03/28 TI - Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información JF - Anales de Documentación JA - An. Documentación VL - 5 IS - 0 SE - Artículos DO - UR - https://revistas.um.es/analesdoc/article/view/2101 SP - 273-286 AB - Reflexión sintética para revisar las propuestas más relevantes que, siguiendo la teoría matemática de la comunicación de Shannon y Weaver, hayan afectado a los procedimientos del análisis automático del contenido documental. Partiendo del empleo de la teoría matemática en Ciencia de la Información se explican sus aplicaciones metodológicas en nuestra especialidad, en especial respecto a las técnicas de recuperación de la información. Para después describir los modelos matemáticos aplicados al análisis automático del contenido: leyes de Zipf yGoffman, antidiccionarios para índices permutados, Indización Estadística de Términos por Frecuencias, algoritmos n-grams y de stemming, así como los referidos a los métodos de agrupación y clasificación como clusters por valor de discriminación y por relevancia de los términos como son los métodos de agrupación basados en Grafos Teóricos, los basados en Centros de masas, el algoritmo K-vecinos o Kmedias,el K-vecinos axial o incremental, y el algoritmo ISODATA. Para luego exponer los clasificadores cienciométricos como el método de Chen y finalmente los métodos con sistemas de aprendizaje ER -