Léxico e Modelização Computacional

Investigador responsável:

Este grupo de trabalho tem como principais objetivos produzir conhecimento e desenvolver recursos linguísticos sobre léxico e sobre formação de palavras. Estes objetivos são orientados tanto para o desenvolvimento de ferramentas para o público em geral e para a comunidade como para um público mais especializado.

O trabalho desenvolvido é focado na língua portuguesa, tomada sob uma perspetiva pluricêntrica, e passa em grande parte pelo desenvolvimento dos recursos disponibilizados no Portal da Língua Portuguesa e pela descrição e modelização do comportamento de operadores morfológicos do português.

Inventariação e estudo do léxico do português

Descrição dos processos morfológicos envolvidos na construção de palavras

Estudo dos sistemas de representação do léxico, nomeadamente lexicográficos

Estudo da ortografia e dos processos de normalização do português e suas implicações para a política linguística

Criação de recursos de modelização dos processos morfológicos e de representação do léxico

Desenvolvimento de ferramentas e recursos linguísticos úteis para a comunidade

Em curso 

Desenvolvimento de Recursos e Metodologias para a elaboração de um Dicionário de Português Pluricêntrico (FCT UIDP/04887/2020 e UIDB/04887/2020)

Pesquisa sobre uso de dicionários de português nos países de língua portuguesa – USODIPO (FCT UIDP/04887/2020 e UIDB/04887/2020)

Crowdsourcing Corpus Filtering for Pedagogical Purposes (enetCollect COST Action, FCT UIDP/04887/2020 e UIDB/04887/2020)

Crowdsourcing for Language Learning Game (CrowLL game) (CLARIN Family Resources Funding, FCT UIDP/04887/2020 e UIDB/04887/2020)

Development of methodology and improvements to lexicographic resources for an online platform for academic collocation dictionaries in Portuguese and English (CNPq – National Council for Scientific and Technological Development (Process Number 409178/2021-7; FCT UIDP/04887/2020 e UIDB/04887/2020)

Concluídos 

Vocabulário Ortográfico Comum da Língua Portuguesa (VOC) (coordenação IILP, financiamento CPLP

Vocabulário Ortográfico do Português, 2ª edição 

Vocabulário toponímico

Analisador Morfológico-Semântico (fin. FCT) 

Uma Escola Multilingue – Projeto desenvolvido em parceria com o Agrupamento Vertical de Escolas do Vale da Amoreira sobre consciência linguística, aprendizagem de línguas e sucesso educativo em contexto multilingue

LUPo – Léxico Unisyn do Português: Um Léxico de Pronúncia Independente do Dialeto para o Português (financiamento FCT) – Objetivo: um conjunto de ferramentas de código aberto que permitem gerar realizações fonéticas em vários dialetos (da África, Ásia, Europa e América do Sul) a partir de entradas lexicais individuais ou textos inteiros. (Texto em Inglês) 

ORAL-PHON: um corpus de fala espontânea do Português Europeu transcrito foneticamente – Objetivo: transcrever foneticamente e disponibilizar um corpus de fala espontânea

Analisador Morfológico Semântico – Objetivo: levantamento e análise de derivados lexicalizados e construção de um analisador morfológico

Bilinguismo, aprendizagem do Português L2 e sucesso educativo na Escola Portuguesa – Objetivo: apoiar os professores do Ensino Básico no ensino do Português aos alunos com outras línguas maternas. Provar que o modelo de ensino bilingue conduz a resultados melhores que os do modelo tradicional

Portal da Língua Portuguesa – Objetivo: construção e desenvolvimento do recurso lexical MorDebe, contendo informação sobre a flexão, a derivação, a ortografia e a pronúncia das palavras

ONP – Observatório de Neologia do Português – Objetivo: levantamento e análise de novas palavras na língua portuguesa

Manually Annotated Corpora for Teaching and Learning Purposes of Brazilian Portuguese, Dutch, Estonian, and Slovene – the CrowLL Project https://hdl.handle.net/21.11129/0000-0010-05DA-3 (CLARIN Family Resources Funding, FCT UIDP/04887/2020 e UIDB/04887/2020)

Terminologias Científicas e Técnicas Comuns (TCTC) – Fase 1.2 – (coordenação  IILP, financiamento Comunidade dos Países de Língua Portuguesa – CPLP

Ana Vieira Barbosa Membro integrado
Ana Alexandra Ribeiro Luis Membro integrado
Graça Rio-Torto Membro integrado
Isabel Pereira Membro integrado
Margarita Correia Membro integrado
Rui Abel Rodrigues Pereira Membro integrado
Susana da Costa Nunes Membro integrado
Tanara Zingano Kuhn Membro integrado
Agostinho Salgueiro Membro colaborador
John Lachlan Mackenzie Membro colaborador
Andressa Gomide Membro externo
Antonia Vieira dos Santos Membro externo
Maarten Janssen Membro externo
Mailson dos Santos Lopes Membro externo
Riccardo Giomi Membro externo
Sílvia Ribeiro Membro externo

Fotografia: João Viegas