Застосування сховищ даних для виявлення плагіату в текстових документах

Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-сл...

Full description

Saved in:

Bibliographic Details
Main Authors:	Д. Галайко, Ю. Олійник
Format:	Article
Language:	English
Published:	Igor Sikorsky Kyiv Polytechnic Institute 2024-10-01
Series:	Adaptivni Sistemi Avtomatičnogo Upravlinnâ
Subjects:	виявлення плагіату NLP потік Apache Hive DynamoDB сховища даних
Online Access:	https://asac.kpi.ua/article/view/313093
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1849420296593866752
author	Д. Галайко Ю. Олійник
author_facet	Д. Галайко Ю. Олійник
author_sort	Д. Галайко
collection	DOAJ
description	Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-слів, видалення підміни символів, заміни на синоніми. Створено тестовий набір даних для аналізу продуктивності рішення Проведено дослідження ефективності застосованих сховищ даних, виконано їх порівняльний аналіз та проведено декілька прогонів для уникнення стохастичної помилки. За результатами тестування моделей виокремлено DynamoDB як найефективніше сховище даних для задачі виявлення запозичень. Бібл. 14, іл. 8, табл. 3
format	Article
id	doaj-art-0a41294062a847a3982942e59ee93b03
institution	Kabale University
issn	1560-8956 2522-9575
language	English
publishDate	2024-10-01
publisher	Igor Sikorsky Kyiv Polytechnic Institute
record_format	Article
series	Adaptivni Sistemi Avtomatičnogo Upravlinnâ
spelling	doaj-art-0a41294062a847a3982942e59ee93b032025-08-20T03:31:47ZengIgor Sikorsky Kyiv Polytechnic InstituteAdaptivni Sistemi Avtomatičnogo Upravlinnâ1560-89562522-95752024-10-0124510.20535/1560-8956.45.2024.313093352907Застосування сховищ даних для виявлення плагіату в текстових документахД. Галайко0Ю. Олійник1КПІ ім. Ігоря СікорськогоКПІ ім. Ігоря Сікорського Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-слів, видалення підміни символів, заміни на синоніми. Створено тестовий набір даних для аналізу продуктивності рішення Проведено дослідження ефективності застосованих сховищ даних, виконано їх порівняльний аналіз та проведено декілька прогонів для уникнення стохастичної помилки. За результатами тестування моделей виокремлено DynamoDB як найефективніше сховище даних для задачі виявлення запозичень. Бібл. 14, іл. 8, табл. 3 https://asac.kpi.ua/article/view/313093виявлення плагіатуNLPпотікApache HiveDynamoDBсховища даних
spellingShingle	Д. Галайко Ю. Олійник Застосування сховищ даних для виявлення плагіату в текстових документах Adaptivni Sistemi Avtomatičnogo Upravlinnâ виявлення плагіату NLP потік Apache Hive DynamoDB сховища даних
title	Застосування сховищ даних для виявлення плагіату в текстових документах
title_full	Застосування сховищ даних для виявлення плагіату в текстових документах
title_fullStr	Застосування сховищ даних для виявлення плагіату в текстових документах
title_full_unstemmed	Застосування сховищ даних для виявлення плагіату в текстових документах
title_short	Застосування сховищ даних для виявлення плагіату в текстових документах
title_sort	застосування сховищ даних для виявлення плагіату в текстових документах
topic	виявлення плагіату NLP потік Apache Hive DynamoDB сховища даних
url	https://asac.kpi.ua/article/view/313093
work_keys_str_mv	AT dgalajko zastosuvannâshoviŝdanihdlâviâvlennâplagíatuvtekstovihdokumentah AT ûolíjnik zastosuvannâshoviŝdanihdlâviâvlennâplagíatuvtekstovihdokumentah

Застосування сховищ даних для виявлення плагіату в текстових документах

Similar Items