Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin

Izvleček Zakon o obveznem izvodu publikacij (2006) Narodni in univerzitetni knjižnici (NUK) nalaga skrb za zajem, ohranjanje in nudenje dostopa uporabnikom do zajetih spletnih publikacij, spletnih mest in vsebin. Leta 2015 je NUK opravil prvi zajem slovenske domene .si, naslove spletnih domen je pr...

Full description

Saved in:
Bibliographic Details
Main Authors: Matjaž Kragelj, Mitja Kovačič
Format: Article
Language:English
Published: Slovenian Library Association & University of Ljubljana Press (Založba Univerze v Ljubljani) 2017-03-01
Series:Knjižnica
Subjects:
Online Access:https://journals.uni-lj.si/knjiznica/article/view/13841
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1850253083486978048
author Matjaž Kragelj
Mitja Kovačič
author_facet Matjaž Kragelj
Mitja Kovačič
author_sort Matjaž Kragelj
collection DOAJ
description Izvleček Zakon o obveznem izvodu publikacij (2006) Narodni in univerzitetni knjižnici (NUK) nalaga skrb za zajem, ohranjanje in nudenje dostopa uporabnikom do zajetih spletnih publikacij, spletnih mest in vsebin. Leta 2015 je NUK opravil prvi zajem slovenske domene .si, naslove spletnih domen je priskrbel Arnes (Akademska in raziskovalna mreža Slovenije). V prispevku se osredotočamo na pomen zajema spletnih vsebin zaradi vsakodnevnega propadanja spletnih domen. Poleg zajema in dejavnosti za zagotavljanje ohranjanja zajetih vsebin je v prispevku tematizirano tudi pridobivanje informacij iz nestrukturiranih vsebin (spletnih dokumentov). Omenjeni so primeri in delovanje aplikacij za zajemanje specifičnih informacij iz različnih spletnih dokumentov, npr. zajem cene določenega artikla v določeni trgovini z namenom obveščanja končnega uporabnika o najugodnejši ponudbi na trgu. Večji del prispevka je namenjen analizi zajetih spletnih vsebin in možnosti luščenja ter uteževanja besedišča, pridobljenega iz spletnih dokumentov. Z algoritmi in statistikami za označevanje in razvrščanje terminov v množici spletnih vsebin se spletni arhiv iz pasivne podatkovne zbirke spremeni v okolje, ki omogoča dodano vrednost povezovanja podatkov, iskanja sorodnosti znotraj podatkov spletnega arhiva in s podatki zunaj njega.
format Article
id doaj-art-f06822deffe949ce9db3ad0c3f1204ca
institution OA Journals
issn 0023-2424
1581-7903
language English
publishDate 2017-03-01
publisher Slovenian Library Association & University of Ljubljana Press (Založba Univerze v Ljubljani)
record_format Article
series Knjižnica
spelling doaj-art-f06822deffe949ce9db3ad0c3f1204ca2025-08-20T01:57:28ZengSlovenian Library Association & University of Ljubljana Press (Založba Univerze v Ljubljani)Knjižnica0023-24241581-79032017-03-01611-210.55741/knj.61.1-2.13841Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebinMatjaž Kragelj0Mitja Kovačič1Narodna in univerzitetna knjižnica, Turjaška 1, 1000 Ljubljana e-pošta: matjaz.kragelj@nuk.uni-lj.siNarodna in univerzitetna knjižnica, Turjaška 1, 1000 Ljubljana e-pošta: mitja.kovacic@nuk.uni-lj.si Izvleček Zakon o obveznem izvodu publikacij (2006) Narodni in univerzitetni knjižnici (NUK) nalaga skrb za zajem, ohranjanje in nudenje dostopa uporabnikom do zajetih spletnih publikacij, spletnih mest in vsebin. Leta 2015 je NUK opravil prvi zajem slovenske domene .si, naslove spletnih domen je priskrbel Arnes (Akademska in raziskovalna mreža Slovenije). V prispevku se osredotočamo na pomen zajema spletnih vsebin zaradi vsakodnevnega propadanja spletnih domen. Poleg zajema in dejavnosti za zagotavljanje ohranjanja zajetih vsebin je v prispevku tematizirano tudi pridobivanje informacij iz nestrukturiranih vsebin (spletnih dokumentov). Omenjeni so primeri in delovanje aplikacij za zajemanje specifičnih informacij iz različnih spletnih dokumentov, npr. zajem cene določenega artikla v določeni trgovini z namenom obveščanja končnega uporabnika o najugodnejši ponudbi na trgu. Večji del prispevka je namenjen analizi zajetih spletnih vsebin in možnosti luščenja ter uteževanja besedišča, pridobljenega iz spletnih dokumentov. Z algoritmi in statistikami za označevanje in razvrščanje terminov v množici spletnih vsebin se spletni arhiv iz pasivne podatkovne zbirke spremeni v okolje, ki omogoča dodano vrednost povezovanja podatkov, iskanja sorodnosti znotraj podatkov spletnega arhiva in s podatki zunaj njega. https://journals.uni-lj.si/knjiznica/article/view/13841spletni arhivifrekvenca pojavljanjatf-idfluščenje podatkovspletni zajemidomena .si
spellingShingle Matjaž Kragelj
Mitja Kovačič
Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin
Knjižnica
spletni arhivi
frekvenca pojavljanja
tf-idf
luščenje podatkov
spletni zajemi
domena .si
title Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin
title_full Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin
title_fullStr Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin
title_full_unstemmed Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin
title_short Uporabna vrednost podatkov spletnih zajemov: arhiviranje spletnih mest in analiza spletnih vsebin
title_sort uporabna vrednost podatkov spletnih zajemov arhiviranje spletnih mest in analiza spletnih vsebin
topic spletni arhivi
frekvenca pojavljanja
tf-idf
luščenje podatkov
spletni zajemi
domena .si
url https://journals.uni-lj.si/knjiznica/article/view/13841
work_keys_str_mv AT matjazkragelj uporabnavrednostpodatkovspletnihzajemovarhiviranjespletnihmestinanalizaspletnihvsebin
AT mitjakovacic uporabnavrednostpodatkovspletnihzajemovarhiviranjespletnihmestinanalizaspletnihvsebin