Extração de Informação Aberta com LLM para a Língua Portuguesa
Neste estudo, investigamos a aplicação de Modelos de Linguagem de Grande Escala (LLMs) para Extração de Informação Aberta (EIA) em língua portuguesa. Enquanto a maioria dos métodos de EIA foi desenvolvida visando a língua inglesa, poucos trabalhos na literatura exploram cenários multilíngues e inte...
Saved in:
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Catalan |
Published: |
Universidade do Minho & Universidade de Vigo
2025-01-01
|
Series: | Linguamática |
Subjects: | |
Online Access: | https://linguamatica.com/index.php/linguamatica/article/view/454 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
_version_ | 1832592909087539200 |
---|---|
author | Bruno Cabral Marlo Souza Daniela Barreiro Claro |
author_facet | Bruno Cabral Marlo Souza Daniela Barreiro Claro |
author_sort | Bruno Cabral |
collection | DOAJ |
description |
Neste estudo, investigamos a aplicação de Modelos de Linguagem de Grande Escala (LLMs) para Extração de Informação Aberta (EIA) em língua portuguesa. Enquanto a maioria dos métodos de EIA foi desenvolvida visando a língua inglesa, poucos trabalhos na literatura exploram cenários multilíngues e interlinguísticos. Embora haja um crescente interesse em métodos de EIA para o português, o uso de LLMs especificamente focados em EIA nesta língua ainda é pouco explorado. Analisamos a viabilidade de incorporar LLMs abertos e comerciais utilizando engenharia de prompts com poucos exemplos para EIA em português. Fornecemos uma análise detalhada do desempenho desses LLMs em tarefas de EIA, demonstrando que eles alcançam métricas de desempenho comparáveis aos sistemas de última geração. Além disso, refinamos e lançamos um LLM aberto para EIA, denominado PortOIE-Llama, que supera os LLMs comerciais em nossos experimentos. Nossos resultados destacam o potencial dos LLMs em tarefas de EIA em português e sugerem que um refinamento e ajuste fino de modelos maiores podem aprimorar ainda mais esses resultados.
|
format | Article |
id | doaj-art-1a721a9149d14a3ca5455ef8552713ca |
institution | Kabale University |
issn | 1647-0818 |
language | Catalan |
publishDate | 2025-01-01 |
publisher | Universidade do Minho & Universidade de Vigo |
record_format | Article |
series | Linguamática |
spelling | doaj-art-1a721a9149d14a3ca5455ef8552713ca2025-01-20T22:41:54ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182025-01-01162Extração de Informação Aberta com LLM para a Língua PortuguesaBruno CabralMarlo Souza0Daniela Barreiro Claro1Universidade Federal da BahiaDepartamento de Ciência da ComputaçãoUniversidade Federal da Bahia Neste estudo, investigamos a aplicação de Modelos de Linguagem de Grande Escala (LLMs) para Extração de Informação Aberta (EIA) em língua portuguesa. Enquanto a maioria dos métodos de EIA foi desenvolvida visando a língua inglesa, poucos trabalhos na literatura exploram cenários multilíngues e interlinguísticos. Embora haja um crescente interesse em métodos de EIA para o português, o uso de LLMs especificamente focados em EIA nesta língua ainda é pouco explorado. Analisamos a viabilidade de incorporar LLMs abertos e comerciais utilizando engenharia de prompts com poucos exemplos para EIA em português. Fornecemos uma análise detalhada do desempenho desses LLMs em tarefas de EIA, demonstrando que eles alcançam métricas de desempenho comparáveis aos sistemas de última geração. Além disso, refinamos e lançamos um LLM aberto para EIA, denominado PortOIE-Llama, que supera os LLMs comerciais em nossos experimentos. Nossos resultados destacam o potencial dos LLMs em tarefas de EIA em português e sugerem que um refinamento e ajuste fino de modelos maiores podem aprimorar ainda mais esses resultados. https://linguamatica.com/index.php/linguamatica/article/view/454EIALLMextração de informaçãocorpus |
spellingShingle | Bruno Cabral Marlo Souza Daniela Barreiro Claro Extração de Informação Aberta com LLM para a Língua Portuguesa Linguamática EIA LLM extração de informação corpus |
title | Extração de Informação Aberta com LLM para a Língua Portuguesa |
title_full | Extração de Informação Aberta com LLM para a Língua Portuguesa |
title_fullStr | Extração de Informação Aberta com LLM para a Língua Portuguesa |
title_full_unstemmed | Extração de Informação Aberta com LLM para a Língua Portuguesa |
title_short | Extração de Informação Aberta com LLM para a Língua Portuguesa |
title_sort | extracao de informacao aberta com llm para a lingua portuguesa |
topic | EIA LLM extração de informação corpus |
url | https://linguamatica.com/index.php/linguamatica/article/view/454 |
work_keys_str_mv | AT brunocabral extracaodeinformacaoabertacomllmparaalinguaportuguesa AT marlosouza extracaodeinformacaoabertacomllmparaalinguaportuguesa AT danielabarreiroclaro extracaodeinformacaoabertacomllmparaalinguaportuguesa |