A design proposal of an on-line corpus-driven dictionary of Portuguese for university students

Investigador

Orientadores

Margarita Correia (CELGA-ILTEC/FLUL)
Carlos A. M. Gouveia (CELGA-ILTEC/FLUL)

Instituições participantes

CELGA-ILTEC (Acolhimento)
Universidade de Lisboa, Faculdade de Letras (Inscrição)
CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Financiadora, ref. 0973/13-0)

Este estudo propõe um desenho de dicionário online corpus-driven de Português para estudantes universitários. Para tanto, o processo lexicográfico a ser seguido envolve: criação do perfil do usuário; construção de um corpus de textos publicados em revistas acadêmicas online do Brasil e de Portugal; proposta de nomenclatura conforme o resultado da análise lexical do corpus compilado; e escrita de verbetes-pilotos a partir dos dados encontrados no corpus. O referencial teórico-metodológico provém das áreas da metalexicografia, linguística de corpus, lexicografia e linguística computacional. Para análise e tratamento dos dados e escrita de verbetes, adota-se o método de extração automática de informação de corpus e exportação para sistema de escrita de dicionários (cf. Gantar et al., 2016), empregando-se a ferramenta de compilação e análise de corpora Sketch Engine (Kilgarriff et al., 2004) e o sistema de escrita de dicionários iLex (Erlandsen, 2010). Pretende-se, com esta pesquisa, colaborar com a área de estudos do letramento em português no ensino superior e com a lexicografia de língua portuguesa.

De fevereiro a maio de 2016, foi realizada missão de investigação junto à Universidade de Liubliana, Eslovênia, sob orientação do prof. Iztok Kosem. O projeto de trabalho foi selecionado para o programa Short-Term Scientific Mission, promovido pelo COST (European Cooperation in Science and Technology), no âmbito da ação ENeL (European Network of e-Lexicography).

Concluído em 2017, disponível aqui.