Use of text mining in informational sources for groups of rural producers

Authors

DOI: https://doi.org/10.6018/analesdoc.611661
Keywords: Lexical adherence, Text mining, Data access, Government data, Solidarity economy

Supporting Agencies

  • CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior)

Abstract

Observing the need for technological tools to analyze elements of informational fields and recognize links between data sources accessed by certain subjects, this research examines data published for groups of rural producers. It focuses on communications for these groups and government datasets from Brazil. The objective is to verify lexical adherence between units extracted from news for producers in Brazil and government datasets, analyzing informational needs. The methods include a literature review, the 5W1H technique, text mining techniques, and similarity calculation in R. The results indicate insufficient communication, with proximity only in the Credit category. The similarity between the two sources is favorable at an initial level, but there is a need for better contextualization of some words. Future studies aim to contrast this procedure with other similarity measures and apply it to different sources and socioeconomic contexts.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Author Biographies

Jacquelin Teresa Camperos-Reyes, Universidade Estadual Paulista UNESP FCC Marília (Brasil)

Doutora em Ciência da Informação pela Universidade Estadual Paulista, UNESP, Brasil.

Professora Adjunta da Universidade Federal do Pará, UFPA, Brasil.

Ricardo Cesar Gonçalves Sant'Ana

Doutor em Ciência da Informação pela Universidade Estadual Paulista (UNESP).

Docente no Programa de Pós-Graduação em Ciência da Informação da UNESP, Marília, São Paulo, Brasil.

References

AGÊNCIA BRASIL. (2021). Brasil exporta menos carne, mas registra aumento de faturamento: De janeiro a maio foram exportadas 710.093 toneladas. https://agenciabrasil.ebc.com.br/economia/noticia/2021-06/brasil-exporta-menos-carne-mas-registra-aumento-de-faturamento

BARRETO, A. de A. (2002). O tempo e o espaço da ciência da informação. Transinformação, v. 14, n. 1, 17-24, jan/jun. 2002. https://www.scielo.br/j/tinf/a/H3pxvkm6ZjBKNfMLsp7Gfrt/?format=pdf&lang=pt

BORKO, H. (1968). Information science: what is it? American Documentation, v. 19, n. 1, 3-5,. https://doi.org/10.1002/asi.5090190103

BRASIL. Ministério da Agricultura, Pecuária e Abastecimento. (2023). Febre aftosa. https://www.gov.br/agricultura/pt-br/assuntos/sanidade-animal-e-vegetal/saude-animal/programas-de-saude-animal/febre-aftosa/programa-nacional-de-erradicacao-de-febre-aftosa-pnefa

CAMPEROS-REYES, J. T. et al. (2020). Elementos de modelado para intercambio de información en ciencia de la información e ingeniería de sistemas. Ciência da Informação, v. 49, n. 1. https://doi.org/10.18225/ci.inf.v49i1.4801

CAMPEROS-REYES, J. T. (2023). Aderência Lexical a dados publicados para produtores rurais. http://hdl.handle.net/11449/242749

CASTRO, L. N.; FERRARI, D. G. (2016). Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva.

CNA/SENAR. Programa Alimentos Artesanais e Tradicionais. (2022). https://www.cnabrasil.org.br/projetos-e-programas/alimentos-artesanais-e-tradicionais

CENTRO DE ESTUDOS AVANÇADOS EM ECONOMIA APLICADA. (2022a). Sobre o Cepea. https://www.cepea.esalq.usp.br/br/sobre-o-cepea.aspx

CENTRO DE ESTUDOS AVANÇADOS EM ECONOMIA APLICADA. (2022b). CepeaEsalqUSP. https://www.youtube.com/channel/UCxWkJKksyxJD3ccmEZxBIqw

CONFEDERAÇÃO DA AGRICULTURA E PECUARIA DO BRASIL. (2022a). Destaques. https://www.cnabrasil.org.br/

CONFEDERAÇÃO DA AGRICULTURA E PECUARIA DO BRASIL. CNA/SENAR. (2022b). Projeto Campo Futuro. https://www.cnabrasil.org.br/projetos-e-programas/campo-futuro#:~:text=O%20Campo%20Futuro%20%C3%A9%20um,se%20destina%20aos%20produtores%20rurais

DUTRA, M. L. Mineração Textual: entrevista com o prof. Moisé Dutra. (2021). https://youtu.be/WOLU_67MmEA

EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA. (2020). Produção dos Cafés do Brasil atinge 61,62 milhões de sacas de 60kg em 2020, volume 25% maior que 2019. https://www.embrapa.br/busca-de-noticias/-/noticia/56084554/producao-dos-cafes-do-brasil-atinge-6162-milhoes-de-sacas-de-60kg-em-2020-volume-25-maior-que-2019

EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA. (2022). Embrapa Suínos e Aves. Especial: Sanidade Animal Peste Suína Africana. https://www.embrapa.br/suinos-e-aves/psa

EMPRESA DE PESQUISA AGROPECUÁRIA E EXTENSÃO RURAL DE SANTA CATARINA. (2021). Conceitos e métodos aplicados à gestão de empreendimentos rurais e custos de produção nos programas da Epagri 2021. https://docweb.epagri.sc.gov.br/website_cepa/publicacoes/Conceitos_Metodos_Gestao_Custo_producao_programas.pdf

FEDERAÇÃO DA AGRICULTURA E PECUÁRIA DO ESTADO DO ESPÍRITO SANTO. (2022). Presentaçao. https://faes.org.br/apresentacao_faes

FEDERAÇÃO DA AGRICULTURA E PECUÁRIA DO ESTADO DE MINAS GERAIS. (2022). Sistema FAEMG. http://www.faemg.org.br/faemg/

FEDERAÇÃO DA AGRICULTURA E PECUÁRIA DO PARÁ. (2022). A FAEPA: o qué é? http://sistemafaepa.com.br/faepa/a-faepa/

FELDMAN, R.; SANGER, J. (2006). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press. https://dl.icdst.org/pdfs/files/25a6d982ee80e1db7a4ebf7eeca4e0ec.pdf

FRICKÉ, M. (2013). Logic and the Organization of Information: An Introduction. North American Symposium on Knowledge Organization (NASKO), v.4, n.1, 70-75. https://journals.lib.washington.edu/index.php/nasko/article/view/14646/12290

HEARST, M. A. (1999). Untangling text data mining. In: Proceedings of the 37th Annual meeting of the Association for Computational Linguistics, 3-10. https://aclanthology.org/P99-1001.pdf

HEARST, M. (2003). What is text mining. https://www.jaist.ac.jp/~bao/MOT-Ishikawa/FurtherReadingNo1.pdf

HUANG, A. (2008). Similarity measures for text document clustering. In: Proceedings of the sixth New Zealand Computer Science Research student conference (NZCSRSC2008), 6, 9-56.

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. (2020). Missão Institucional. https://www.ibge.gov.br/acesso-informacao/institucional/o-ibge.html

INSTITUTO DE PESQUISA ECONÔMICA APLICADA. (2011). Políticas Sociais - Um plano para acabar com a miséria. Desafios do desenvolvimento Ano 8, Edicäo 67. https://www.ipea.gov.br/desafios/index.php?option=com_content&id=2579:catid=28

KAO, A. and POTEET, S. R. (Eds.). (2007). Natural language processing and text mining. Springer.

KORN, J.; HUSS, F. and CUMBERS, J. D. (1998). Natural language for modelling situations. In: IEE Colloquium on Natural Language Understanding. London: IET.

MINISTÉRIO DA INDUSTRIA, COMÉRCIO EXTERIOR E SERVIÇOS. (2022). Comex Stat. 2022. https://comexstat.mdic.gov.br/

NADKARNI, P. M., BRANDT, C. and FRAWLEY, S. (1998). Managing attribute-value clinical trials data using the ACT/DB client-server database system. Journal of the American Medical Informatics Association, v. 5, n. 2, 139-151. https://doi.org/10.1136/jamia.1998.0050139

PORTAL DBO. (2012). Brasil, maior exportador global de carne bovina, importou 50,8 mil toneladas premium em 2020. https://www.portaldbo.com.br/brasil-maior-exportador-global-de-carne-bovina-importou-508-mil-toneladas-premium-em-2020/

ROSS, S. D.; CRUZ, B. DE P. A. (2021). Análise Quantitativa de Textos: Apresentação e Operacionalização da Técnica via Twitter. Administração: Ensino e Pesquisa, v. 22, n. 1. https://doi.org/10.13058/raep.2021.v22n1.1859

ROSENFELD, L.; MORVILLE, P. and ARANGO, J. (2015). Information Architecture: For the Web and Beyond.

Sebastopol/CA: O’Reilly.

SANT’ANA, R.C.G. (2019). Campo informacional resultante da interação de ciclos de vida dos dados. In: DIAS, G. A.;

OLIVEIRA, B. M. J. F. de. Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 13-31.

SANTOS, P. L. V. da C.; SANT’ANA, R. C. G. (2019). Camadas de representação de dados e suas especificidades no cenário científico. In: DIAS, G. A.; OLIVEIRA, B. M. J. F. de. Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 53-66.

SERVIÇO NACIONAL DE APRENDIZAGEM RURAL. (2022). SENAR. https://www.cnabrasil.org.br/senar

SILGE, J. ROBINSON, D. (2017). Text Mining with R: A Tidy Approach. O’Reilly. https://www.tidytextmining.com/index.html

SLOAN, M. C. (2010). Aristotle’s nicomachean ethics as the original locus for the septem circumstantiae. Classical Philology, v. 105, 3, 236-251. https://doi.org/10.1086/656196

UOL ECONOMIA. (2022). Peste suína nas Américas. https://economia.uol.com.br/reportagens-especiais/ag

Published
26-11-2024
How to Cite
Camperos-Reyes, J. T., & Gonçalves Sant’Ana, R. C. (2024). Use of text mining in informational sources for groups of rural producers. Information Science Journal, 27. https://doi.org/10.6018/analesdoc.611661
Issue
Section
Research notes and surveys

Most read articles by the same author(s)

Publication Facts

Metric
This article
Other articles
Peer reviewers 
2
2.4

Reviewer profiles  N/A

Author statements

Author statements
This article
Other articles
Data availability 
N/A
16%
External funding 
N/A
32%
Competing interests 
N/A
11%
Metric
This journal
Other journals
Articles accepted 
41%
33%
Days to publication 
229
145

Indexed in

Editor & editorial board
profiles
Academic society 
Anales de Documentación
Publisher 
Ediciones de la Universidad de Murcia (Editum)