GOOFRE version 2: voir et traiter 600 milliards de mots

Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmati...

Full description

Saved in:

Bibliographic Details
Main Authors:	Etienne Brunet, Laurent Vanni
Format:	Article
Language:	Spanish
Published:	Universidade Federal de Santa Catarina 2014-12-01
Series:	Texto Digital
Online Access:	https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1850048802633809920
author	Etienne Brunet Laurent Vanni
author_facet	Etienne Brunet Laurent Vanni
author_sort	Etienne Brunet
collection	DOAJ
description	Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus.
format	Article
id	doaj-art-31cc92c5bbc64e67b63dcce25b670e75
institution	DOAJ
issn	1807-9288
language	Spanish
publishDate	2014-12-01
publisher	Universidade Federal de Santa Catarina
record_format	Article
series	Texto Digital
spelling	doaj-art-31cc92c5bbc64e67b63dcce25b670e752025-08-20T02:53:51ZspaUniversidade Federal de Santa CatarinaTexto Digital1807-92882014-12-0110210.5007/1807-9288.2014v10n2p7522871GOOFRE version 2: voir et traiter 600 milliards de motsEtienne Brunet0Laurent Vanni1Université de Nice Sophia AntipolisUniversité de Nice Sophia Antipolis Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus. https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
spellingShingle	Etienne Brunet Laurent Vanni GOOFRE version 2: voir et traiter 600 milliards de mots Texto Digital
title	GOOFRE version 2: voir et traiter 600 milliards de mots
title_full	GOOFRE version 2: voir et traiter 600 milliards de mots
title_fullStr	GOOFRE version 2: voir et traiter 600 milliards de mots
title_full_unstemmed	GOOFRE version 2: voir et traiter 600 milliards de mots
title_short	GOOFRE version 2: voir et traiter 600 milliards de mots
title_sort	goofre version 2 voir et traiter 600 milliards de mots
url	https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
work_keys_str_mv	AT etiennebrunet goofreversion2voirettraiter600milliardsdemots AT laurentvanni goofreversion2voirettraiter600milliardsdemots

GOOFRE version 2: voir et traiter 600 milliards de mots

Similar Items