Processamento automático de expressões idiomáticas do português europeu

Expressões idiomáticas verbais são expressões multipalavra em que o verbo principal é distribucionalmente fixo com um ou mais dos seus argumentos. O significado global destas expressões é, geralmente, não composicional, isto é, não pode ser regularmente inferido a partir do significado individual d...

Full description

Saved in:
Bibliographic Details
Main Authors: David Antunes, Jorge Baptista, Nuno Mamede
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2025-07-01
Series:Linguamática
Subjects:
Online Access:https://linguamatica.com/index.php/linguamatica/article/view/464
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849425577106210816
author David Antunes
Jorge Baptista
Nuno Mamede
author_facet David Antunes
Jorge Baptista
Nuno Mamede
author_sort David Antunes
collection DOAJ
description Expressões idiomáticas verbais são expressões multipalavra em que o verbo principal é distribucionalmente fixo com um ou mais dos seus argumentos. O significado global destas expressões é, geralmente, não composicional, isto é, não pode ser regularmente inferido a partir do significado individual dos seus constituintes, quando usados separadamente. O principal objetivo deste trabalho é a construção de um sistema capaz de processar expressões idiomáticas do português europeu, integrado de forma fluida numa cadeia (pipeline) de processamento de linguagem natural. Para tal, foram desenvolvidas duas componentes fundamentais: (i) a criação de um corpus anotado com instâncias de expressões idiomáticas verbais do português europeu, e (ii) o desenvolvimento de um sistema que gera regras de análise de dependência para identificar automaticamente expressões idiomáticas com base nas restrições linguísticas representadas numa matriz léxico-gramatical. O sistema foi avaliado com frases produzidas manualmente, frases geradas artificialmente (por um módulo específico do sistema) e usando documentos selecionados a partir de dois corpora e onde foram anotadas instâncias de expressões idiomáticas. Os resultados globais indicam que a Precisão do sistema é bastante satisfatória, enquanto a Abrangência (Recall) é menos favorável. Estes dados destacam a necessidade de direcionar esforços para melhorar o desempenho do sistema, nomeadamente das regras que permitem identificar automaticamente as expressões fixas em textos. Uma parte do corpus utilizado bem como das anotações de expressões idiomáticas são disponibilizados para a comunidade científica.
format Article
id doaj-art-a37cd57cc1f548b3bd9afcf94cccc98a
institution Kabale University
issn 1647-0818
language Catalan
publishDate 2025-07-01
publisher Universidade do Minho & Universidade de Vigo
record_format Article
series Linguamática
spelling doaj-art-a37cd57cc1f548b3bd9afcf94cccc98a2025-08-20T03:29:44ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182025-07-01171Processamento automático de expressões idiomáticas do português europeuDavid Antunes0Jorge BaptistaNuno MamedeInstituto Superior Técnico Expressões idiomáticas verbais são expressões multipalavra em que o verbo principal é distribucionalmente fixo com um ou mais dos seus argumentos. O significado global destas expressões é, geralmente, não composicional, isto é, não pode ser regularmente inferido a partir do significado individual dos seus constituintes, quando usados separadamente. O principal objetivo deste trabalho é a construção de um sistema capaz de processar expressões idiomáticas do português europeu, integrado de forma fluida numa cadeia (pipeline) de processamento de linguagem natural. Para tal, foram desenvolvidas duas componentes fundamentais: (i) a criação de um corpus anotado com instâncias de expressões idiomáticas verbais do português europeu, e (ii) o desenvolvimento de um sistema que gera regras de análise de dependência para identificar automaticamente expressões idiomáticas com base nas restrições linguísticas representadas numa matriz léxico-gramatical. O sistema foi avaliado com frases produzidas manualmente, frases geradas artificialmente (por um módulo específico do sistema) e usando documentos selecionados a partir de dois corpora e onde foram anotadas instâncias de expressões idiomáticas. Os resultados globais indicam que a Precisão do sistema é bastante satisfatória, enquanto a Abrangência (Recall) é menos favorável. Estes dados destacam a necessidade de direcionar esforços para melhorar o desempenho do sistema, nomeadamente das regras que permitem identificar automaticamente as expressões fixas em textos. Uma parte do corpus utilizado bem como das anotações de expressões idiomáticas são disponibilizados para a comunidade científica. https://linguamatica.com/index.php/linguamatica/article/view/464expressões multipalavraportuguês europeuexpressões idiomáticasexpressões fixasléxico-gramática
spellingShingle David Antunes
Jorge Baptista
Nuno Mamede
Processamento automático de expressões idiomáticas do português europeu
Linguamática
expressões multipalavra
português europeu
expressões idiomáticas
expressões fixas
léxico-gramática
title Processamento automático de expressões idiomáticas do português europeu
title_full Processamento automático de expressões idiomáticas do português europeu
title_fullStr Processamento automático de expressões idiomáticas do português europeu
title_full_unstemmed Processamento automático de expressões idiomáticas do português europeu
title_short Processamento automático de expressões idiomáticas do português europeu
title_sort processamento automatico de expressoes idiomaticas do portugues europeu
topic expressões multipalavra
português europeu
expressões idiomáticas
expressões fixas
léxico-gramática
url https://linguamatica.com/index.php/linguamatica/article/view/464
work_keys_str_mv AT davidantunes processamentoautomaticodeexpressoesidiomaticasdoportugueseuropeu
AT jorgebaptista processamentoautomaticodeexpressoesidiomaticasdoportugueseuropeu
AT nunomamede processamentoautomaticodeexpressoesidiomaticasdoportugueseuropeu