Abstract
O termo "Engenharia de Dados"(ED) tem sido utilizado frequentemente na literatura e em propostas curriculares atuais para se referir aos processos de adquirir, organizar e preparar dados para serem consumidos em análises exploratórias, como entrada de sistemas e aplicações ou outros contextos similares. Com o surgimento da área de Ciência de Dados, esse termo tem sido usado para englobar o que tradicionalmente era conhecido como gerenciamento de dados. Neste estudo, exploramos a ED no contexto acadêmico e industrial brasileiro, destacando a crescente relevância dessa área na sociedade atual e a necessidade de habilidades relacionadas a ela nos profissionais da área de computação. Este estudo foi motivado pela percepção dos autores de que os avanços de, pelo menos, uma década na indústria em ED ainda não foram adequadamente absorvidos pelo ensino de graduação das universidades. Através de levantamentos realizados sobre as disciplinas, bibliografias e ementas relacionadas à ED, em 23 universidades brasileiras e junto a empresas de tecnologia do país, construímos uma taxonomia dos tópicos ensinados atualmente e uma outra taxonomia de tópicos considerados relevantes para a indústria. O estudo comparativo destas taxonomias revelou que existe uma lacuna entre o ensino de ED e as demandas do mercado, com currículos acadêmicos frequentemente desatualizados quanto a tópicos considerados relevantes para a indústria contemporânea. Em particular, tópicos relacionados a plataformas de dados de alto desempenho, gerência de dados em nuvem e workflow de dados são destacados como grandes necessidades atuais da indústria, mas que são pouco explorados nos currículos atuais. Nosso objetivo, com esse estudo, é subsidiar mudanças nos currículos que possam contribuir para a formação de profissionais mais qualificados e alinhados às necessidades modernas do mercado.
Publisher
Sociedade Brasileira de Computação