Extração de Informação Aberta com LLM para a Língua Portuguesa

Neste estudo, investigamos a aplicação de Modelos de Linguagem de Grande Escala (LLMs) para Extração de Informação Aberta (EIA) em língua portuguesa. Enquanto a maioria dos métodos de EIA foi desenvolvida visando a língua inglesa, poucos trabalhos na literatura exploram cenários multilíngues e inte...

Full description

Saved in:
Bibliographic Details
Main Authors: Bruno Cabral, Marlo Souza, Daniela Barreiro Claro
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2025-01-01
Series:Linguamática
Subjects:
Online Access:https://linguamatica.com/index.php/linguamatica/article/view/454
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1832592909087539200
author Bruno Cabral
Marlo Souza
Daniela Barreiro Claro
author_facet Bruno Cabral
Marlo Souza
Daniela Barreiro Claro
author_sort Bruno Cabral
collection DOAJ
description Neste estudo, investigamos a aplicação de Modelos de Linguagem de Grande Escala (LLMs) para Extração de Informação Aberta (EIA) em língua portuguesa. Enquanto a maioria dos métodos de EIA foi desenvolvida visando a língua inglesa, poucos trabalhos na literatura exploram cenários multilíngues e interlinguísticos. Embora haja um crescente interesse em métodos de EIA para o português, o uso de LLMs especificamente focados em EIA nesta língua ainda é pouco explorado. Analisamos a viabilidade de incorporar LLMs abertos e comerciais utilizando engenharia de prompts com poucos exemplos para EIA em português. Fornecemos uma análise detalhada do desempenho desses LLMs em tarefas de EIA, demonstrando que eles alcançam métricas de desempenho comparáveis aos sistemas de última geração. Além disso, refinamos e lançamos um LLM aberto para EIA, denominado PortOIE-Llama, que supera os LLMs comerciais em nossos experimentos. Nossos resultados destacam o potencial dos LLMs em tarefas de EIA em português e sugerem que um refinamento e ajuste fino de modelos maiores podem aprimorar ainda mais esses resultados.
format Article
id doaj-art-1a721a9149d14a3ca5455ef8552713ca
institution Kabale University
issn 1647-0818
language Catalan
publishDate 2025-01-01
publisher Universidade do Minho & Universidade de Vigo
record_format Article
series Linguamática
spelling doaj-art-1a721a9149d14a3ca5455ef8552713ca2025-01-20T22:41:54ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182025-01-01162Extração de Informação Aberta com LLM para a Língua PortuguesaBruno CabralMarlo Souza0Daniela Barreiro Claro1Universidade Federal da BahiaDepartamento de Ciência da ComputaçãoUniversidade Federal da Bahia Neste estudo, investigamos a aplicação de Modelos de Linguagem de Grande Escala (LLMs) para Extração de Informação Aberta (EIA) em língua portuguesa. Enquanto a maioria dos métodos de EIA foi desenvolvida visando a língua inglesa, poucos trabalhos na literatura exploram cenários multilíngues e interlinguísticos. Embora haja um crescente interesse em métodos de EIA para o português, o uso de LLMs especificamente focados em EIA nesta língua ainda é pouco explorado. Analisamos a viabilidade de incorporar LLMs abertos e comerciais utilizando engenharia de prompts com poucos exemplos para EIA em português. Fornecemos uma análise detalhada do desempenho desses LLMs em tarefas de EIA, demonstrando que eles alcançam métricas de desempenho comparáveis aos sistemas de última geração. Além disso, refinamos e lançamos um LLM aberto para EIA, denominado PortOIE-Llama, que supera os LLMs comerciais em nossos experimentos. Nossos resultados destacam o potencial dos LLMs em tarefas de EIA em português e sugerem que um refinamento e ajuste fino de modelos maiores podem aprimorar ainda mais esses resultados. https://linguamatica.com/index.php/linguamatica/article/view/454EIALLMextração de informaçãocorpus
spellingShingle Bruno Cabral
Marlo Souza
Daniela Barreiro Claro
Extração de Informação Aberta com LLM para a Língua Portuguesa
Linguamática
EIA
LLM
extração de informação
corpus
title Extração de Informação Aberta com LLM para a Língua Portuguesa
title_full Extração de Informação Aberta com LLM para a Língua Portuguesa
title_fullStr Extração de Informação Aberta com LLM para a Língua Portuguesa
title_full_unstemmed Extração de Informação Aberta com LLM para a Língua Portuguesa
title_short Extração de Informação Aberta com LLM para a Língua Portuguesa
title_sort extracao de informacao aberta com llm para a lingua portuguesa
topic EIA
LLM
extração de informação
corpus
url https://linguamatica.com/index.php/linguamatica/article/view/454
work_keys_str_mv AT brunocabral extracaodeinformacaoabertacomllmparaalinguaportuguesa
AT marlosouza extracaodeinformacaoabertacomllmparaalinguaportuguesa
AT danielabarreiroclaro extracaodeinformacaoabertacomllmparaalinguaportuguesa