GOOFRE version 2: voir et traiter 600 milliards de mots

Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un  nouveau traitement a repris les images scannées pour en proposer une lecture  plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation  et de la lemmati...

Full description

Saved in:
Bibliographic Details
Main Authors: Etienne Brunet, Laurent Vanni
Format: Article
Language:Spanish
Published: Universidade Federal de Santa Catarina 2014-12-01
Series:Texto Digital
Online Access:https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1850048802633809920
author Etienne Brunet
Laurent Vanni
author_facet Etienne Brunet
Laurent Vanni
author_sort Etienne Brunet
collection DOAJ
description Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un  nouveau traitement a repris les images scannées pour en proposer une lecture  plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation  et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout  l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus.
format Article
id doaj-art-31cc92c5bbc64e67b63dcce25b670e75
institution DOAJ
issn 1807-9288
language Spanish
publishDate 2014-12-01
publisher Universidade Federal de Santa Catarina
record_format Article
series Texto Digital
spelling doaj-art-31cc92c5bbc64e67b63dcce25b670e752025-08-20T02:53:51ZspaUniversidade Federal de Santa CatarinaTexto Digital1807-92882014-12-0110210.5007/1807-9288.2014v10n2p7522871GOOFRE version 2: voir et traiter 600 milliards de motsEtienne Brunet0Laurent Vanni1Université de Nice Sophia AntipolisUniversité de Nice Sophia Antipolis Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un  nouveau traitement a repris les images scannées pour en proposer une lecture  plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation  et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout  l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus. https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
spellingShingle Etienne Brunet
Laurent Vanni
GOOFRE version 2: voir et traiter 600 milliards de mots
Texto Digital
title GOOFRE version 2: voir et traiter 600 milliards de mots
title_full GOOFRE version 2: voir et traiter 600 milliards de mots
title_fullStr GOOFRE version 2: voir et traiter 600 milliards de mots
title_full_unstemmed GOOFRE version 2: voir et traiter 600 milliards de mots
title_short GOOFRE version 2: voir et traiter 600 milliards de mots
title_sort goofre version 2 voir et traiter 600 milliards de mots
url https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
work_keys_str_mv AT etiennebrunet goofreversion2voirettraiter600milliardsdemots
AT laurentvanni goofreversion2voirettraiter600milliardsdemots