Use of text mining in informational sources for groups of rural producers
Supporting Agencies
- CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior)
Abstract
Observing the need for technological tools to analyze elements of informational fields and recognize links between data sources accessed by certain subjects, this research examines data published for groups of rural producers. It focuses on communications for these groups and government datasets from Brazil. The objective is to verify lexical adherence between units extracted from news for producers in Brazil and government datasets, analyzing informational needs. The methods include a literature review, the 5W1H technique, text mining techniques, and similarity calculation in R. The results indicate insufficient communication, with proximity only in the Credit category. The similarity between the two sources is favorable at an initial level, but there is a need for better contextualization of some words. Future studies aim to contrast this procedure with other similarity measures and apply it to different sources and socioeconomic contexts.
Downloads
Metrics
References
AGÊNCIA BRASIL. (2021). Brasil exporta menos carne, mas registra aumento de faturamento: De janeiro a maio foram exportadas 710.093 toneladas. https://agenciabrasil.ebc.com.br/economia/noticia/2021-06/brasil-exporta-menos-carne-mas-registra-aumento-de-faturamento
BARRETO, A. de A. (2002). O tempo e o espaço da ciência da informação. Transinformação, v. 14, n. 1, 17-24, jan/jun. 2002. https://www.scielo.br/j/tinf/a/H3pxvkm6ZjBKNfMLsp7Gfrt/?format=pdf&lang=pt
BORKO, H. (1968). Information science: what is it? American Documentation, v. 19, n. 1, 3-5,. https://doi.org/10.1002/asi.5090190103
BRASIL. Ministério da Agricultura, Pecuária e Abastecimento. (2023). Febre aftosa. https://www.gov.br/agricultura/pt-br/assuntos/sanidade-animal-e-vegetal/saude-animal/programas-de-saude-animal/febre-aftosa/programa-nacional-de-erradicacao-de-febre-aftosa-pnefa
CAMPEROS-REYES, J. T. et al. (2020). Elementos de modelado para intercambio de información en ciencia de la información e ingeniería de sistemas. Ciência da Informação, v. 49, n. 1. https://doi.org/10.18225/ci.inf.v49i1.4801
CAMPEROS-REYES, J. T. (2023). Aderência Lexical a dados publicados para produtores rurais. http://hdl.handle.net/11449/242749
CASTRO, L. N.; FERRARI, D. G. (2016). Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva.
CNA/SENAR. Programa Alimentos Artesanais e Tradicionais. (2022). https://www.cnabrasil.org.br/projetos-e-programas/alimentos-artesanais-e-tradicionais
CENTRO DE ESTUDOS AVANÇADOS EM ECONOMIA APLICADA. (2022a). Sobre o Cepea. https://www.cepea.esalq.usp.br/br/sobre-o-cepea.aspx
CENTRO DE ESTUDOS AVANÇADOS EM ECONOMIA APLICADA. (2022b). CepeaEsalqUSP. https://www.youtube.com/channel/UCxWkJKksyxJD3ccmEZxBIqw
CONFEDERAÇÃO DA AGRICULTURA E PECUARIA DO BRASIL. (2022a). Destaques. https://www.cnabrasil.org.br/
CONFEDERAÇÃO DA AGRICULTURA E PECUARIA DO BRASIL. CNA/SENAR. (2022b). Projeto Campo Futuro. https://www.cnabrasil.org.br/projetos-e-programas/campo-futuro#:~:text=O%20Campo%20Futuro%20%C3%A9%20um,se%20destina%20aos%20produtores%20rurais
DUTRA, M. L. Mineração Textual: entrevista com o prof. Moisé Dutra. (2021). https://youtu.be/WOLU_67MmEA
EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA. (2020). Produção dos Cafés do Brasil atinge 61,62 milhões de sacas de 60kg em 2020, volume 25% maior que 2019. https://www.embrapa.br/busca-de-noticias/-/noticia/56084554/producao-dos-cafes-do-brasil-atinge-6162-milhoes-de-sacas-de-60kg-em-2020-volume-25-maior-que-2019
EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA. (2022). Embrapa Suínos e Aves. Especial: Sanidade Animal Peste Suína Africana. https://www.embrapa.br/suinos-e-aves/psa
EMPRESA DE PESQUISA AGROPECUÁRIA E EXTENSÃO RURAL DE SANTA CATARINA. (2021). Conceitos e métodos aplicados à gestão de empreendimentos rurais e custos de produção nos programas da Epagri 2021. https://docweb.epagri.sc.gov.br/website_cepa/publicacoes/Conceitos_Metodos_Gestao_Custo_producao_programas.pdf
FEDERAÇÃO DA AGRICULTURA E PECUÁRIA DO ESTADO DO ESPÍRITO SANTO. (2022). Presentaçao. https://faes.org.br/apresentacao_faes
FEDERAÇÃO DA AGRICULTURA E PECUÁRIA DO ESTADO DE MINAS GERAIS. (2022). Sistema FAEMG. http://www.faemg.org.br/faemg/
FEDERAÇÃO DA AGRICULTURA E PECUÁRIA DO PARÁ. (2022). A FAEPA: o qué é? http://sistemafaepa.com.br/faepa/a-faepa/
FELDMAN, R.; SANGER, J. (2006). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press. https://dl.icdst.org/pdfs/files/25a6d982ee80e1db7a4ebf7eeca4e0ec.pdf
FRICKÉ, M. (2013). Logic and the Organization of Information: An Introduction. North American Symposium on Knowledge Organization (NASKO), v.4, n.1, 70-75. https://journals.lib.washington.edu/index.php/nasko/article/view/14646/12290
HEARST, M. A. (1999). Untangling text data mining. In: Proceedings of the 37th Annual meeting of the Association for Computational Linguistics, 3-10. https://aclanthology.org/P99-1001.pdf
HEARST, M. (2003). What is text mining. https://www.jaist.ac.jp/~bao/MOT-Ishikawa/FurtherReadingNo1.pdf
HUANG, A. (2008). Similarity measures for text document clustering. In: Proceedings of the sixth New Zealand Computer Science Research student conference (NZCSRSC2008), 6, 9-56.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. (2020). Missão Institucional. https://www.ibge.gov.br/acesso-informacao/institucional/o-ibge.html
INSTITUTO DE PESQUISA ECONÔMICA APLICADA. (2011). Políticas Sociais - Um plano para acabar com a miséria. Desafios do desenvolvimento Ano 8, Edicäo 67. https://www.ipea.gov.br/desafios/index.php?option=com_content&id=2579:catid=28
KAO, A. and POTEET, S. R. (Eds.). (2007). Natural language processing and text mining. Springer.
KORN, J.; HUSS, F. and CUMBERS, J. D. (1998). Natural language for modelling situations. In: IEE Colloquium on Natural Language Understanding. London: IET.
MINISTÉRIO DA INDUSTRIA, COMÉRCIO EXTERIOR E SERVIÇOS. (2022). Comex Stat. 2022. https://comexstat.mdic.gov.br/
NADKARNI, P. M., BRANDT, C. and FRAWLEY, S. (1998). Managing attribute-value clinical trials data using the ACT/DB client-server database system. Journal of the American Medical Informatics Association, v. 5, n. 2, 139-151. https://doi.org/10.1136/jamia.1998.0050139
PORTAL DBO. (2012). Brasil, maior exportador global de carne bovina, importou 50,8 mil toneladas premium em 2020. https://www.portaldbo.com.br/brasil-maior-exportador-global-de-carne-bovina-importou-508-mil-toneladas-premium-em-2020/
ROSS, S. D.; CRUZ, B. DE P. A. (2021). Análise Quantitativa de Textos: Apresentação e Operacionalização da Técnica via Twitter. Administração: Ensino e Pesquisa, v. 22, n. 1. https://doi.org/10.13058/raep.2021.v22n1.1859
ROSENFELD, L.; MORVILLE, P. and ARANGO, J. (2015). Information Architecture: For the Web and Beyond.
Sebastopol/CA: O’Reilly.
SANT’ANA, R.C.G. (2019). Campo informacional resultante da interação de ciclos de vida dos dados. In: DIAS, G. A.;
OLIVEIRA, B. M. J. F. de. Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 13-31.
SANTOS, P. L. V. da C.; SANT’ANA, R. C. G. (2019). Camadas de representação de dados e suas especificidades no cenário científico. In: DIAS, G. A.; OLIVEIRA, B. M. J. F. de. Dados científicos: perspectivas e desafios. João Pessoa: Editora UFPB, 53-66.
SERVIÇO NACIONAL DE APRENDIZAGEM RURAL. (2022). SENAR. https://www.cnabrasil.org.br/senar
SILGE, J. ROBINSON, D. (2017). Text Mining with R: A Tidy Approach. O’Reilly. https://www.tidytextmining.com/index.html
SLOAN, M. C. (2010). Aristotle’s nicomachean ethics as the original locus for the septem circumstantiae. Classical Philology, v. 105, 3, 236-251. https://doi.org/10.1086/656196
UOL ECONOMIA. (2022). Peste suína nas Américas. https://economia.uol.com.br/reportagens-especiais/ag
This work is licensed under a Creative Commons Attribution 4.0 International License.
Las obras que se publican en esta revista están sujetas a los siguientes términos:
1. El Servicio de Publicaciones de la Universidad de Murcia (Editum) conserva los derechos patrimoniales ('copyright') de las obras publicadas, y favorece y permite la reutilización de las mismas bajo la licencia de uso.
2. Las obras se publican en la edición electrónica de la revista bajo la licencia Creative Commons Atribución Internacional CC BY 4.0. Se puede copiar y redistribuir el material en cualquier medio o formato y remezclar, transformar y crear a partir del material para cualquier finalidad, incluso comercial.