Lexicon of thematic keywords for the automatic classification of TV news
Supporting Agencies
- Centre de l'Audiovisual de Catalunya
Abstract
In the framework of a research project funded by CAC, a communication approach was taken to the problem of keywords selection for the themes indexing of TV news by word spotting. This is, we apply discourse theories (concept of “themes”), news theory and lexicometry and information retrieval techniques, for the definition of a complex Protocol of Keywords Selection. The work of 4 researchers with this protocol on a 698 transcript news sample resulted in a lexicon of 1000 keywords distributed in 15 themes, which is contrasted statistically with Lambda of Wilks.
Downloads
Metrics
Las obras que se publican en esta revista están sujetas a los siguientes términos:
1. El Servicio de Publicaciones de la Universidad de Murcia (Editum) conserva los derechos patrimoniales ('copyright') de las obras publicadas, y favorece y permite la reutilización de las mismas bajo la licencia de uso.
2. Las obras se publican en la edición electrónica de la revista bajo la licencia Creative Commons Atribución Internacional CC BY 4.0. Se puede copiar y redistribuir el material en cualquier medio o formato y remezclar, transformar y crear a partir del material para cualquier finalidad, incluso comercial.