Застосування сховищ даних для виявлення плагіату в текстових документах
Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-сл...
Saved in:
| Main Authors: | , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Igor Sikorsky Kyiv Polytechnic Institute
2024-10-01
|
| Series: | Adaptivni Sistemi Avtomatičnogo Upravlinnâ |
| Subjects: | |
| Online Access: | https://asac.kpi.ua/article/view/313093 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1849420296593866752 |
|---|---|
| author | Д. Галайко Ю. Олійник |
| author_facet | Д. Галайко Ю. Олійник |
| author_sort | Д. Галайко |
| collection | DOAJ |
| description |
Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-слів, видалення підміни символів, заміни на синоніми. Створено тестовий набір даних для аналізу продуктивності рішення Проведено дослідження ефективності застосованих сховищ даних, виконано їх порівняльний аналіз та проведено декілька прогонів для уникнення стохастичної помилки. За результатами тестування моделей виокремлено DynamoDB як найефективніше сховище даних для задачі виявлення запозичень.
Бібл. 14, іл. 8, табл. 3
|
| format | Article |
| id | doaj-art-0a41294062a847a3982942e59ee93b03 |
| institution | Kabale University |
| issn | 1560-8956 2522-9575 |
| language | English |
| publishDate | 2024-10-01 |
| publisher | Igor Sikorsky Kyiv Polytechnic Institute |
| record_format | Article |
| series | Adaptivni Sistemi Avtomatičnogo Upravlinnâ |
| spelling | doaj-art-0a41294062a847a3982942e59ee93b032025-08-20T03:31:47ZengIgor Sikorsky Kyiv Polytechnic InstituteAdaptivni Sistemi Avtomatičnogo Upravlinnâ1560-89562522-95752024-10-0124510.20535/1560-8956.45.2024.313093352907Застосування сховищ даних для виявлення плагіату в текстових документахД. Галайко0Ю. Олійник1КПІ ім. Ігоря СікорськогоКПІ ім. Ігоря Сікорського Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-слів, видалення підміни символів, заміни на синоніми. Створено тестовий набір даних для аналізу продуктивності рішення Проведено дослідження ефективності застосованих сховищ даних, виконано їх порівняльний аналіз та проведено декілька прогонів для уникнення стохастичної помилки. За результатами тестування моделей виокремлено DynamoDB як найефективніше сховище даних для задачі виявлення запозичень. Бібл. 14, іл. 8, табл. 3 https://asac.kpi.ua/article/view/313093виявлення плагіатуNLPпотікApache HiveDynamoDBсховища даних |
| spellingShingle | Д. Галайко Ю. Олійник Застосування сховищ даних для виявлення плагіату в текстових документах Adaptivni Sistemi Avtomatičnogo Upravlinnâ виявлення плагіату NLP потік Apache Hive DynamoDB сховища даних |
| title | Застосування сховищ даних для виявлення плагіату в текстових документах |
| title_full | Застосування сховищ даних для виявлення плагіату в текстових документах |
| title_fullStr | Застосування сховищ даних для виявлення плагіату в текстових документах |
| title_full_unstemmed | Застосування сховищ даних для виявлення плагіату в текстових документах |
| title_short | Застосування сховищ даних для виявлення плагіату в текстових документах |
| title_sort | застосування сховищ даних для виявлення плагіату в текстових документах |
| topic | виявлення плагіату NLP потік Apache Hive DynamoDB сховища даних |
| url | https://asac.kpi.ua/article/view/313093 |
| work_keys_str_mv | AT dgalajko zastosuvannâshoviŝdanihdlâviâvlennâplagíatuvtekstovihdokumentah AT ûolíjnik zastosuvannâshoviŝdanihdlâviâvlennâplagíatuvtekstovihdokumentah |