GOOFRE version 2: voir et traiter 600 milliards de mots

Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmati...

Full description

Saved in:

Bibliographic Details
Main Authors:	Etienne Brunet, Laurent Vanni
Format:	Article
Language:	Spanish
Published:	Universidade Federal de Santa Catarina 2014-12-01
Series:	Texto Digital
Online Access:	https://periodicos.ufsc.br/index.php/textodigital/article/view/35944
Tags:	Add Tag No Tags, Be the first to tag this record!

Description
Summary:	Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus.
ISSN:	1807-9288

GOOFRE version 2: voir et traiter 600 milliards de mots

Similar Items