GOOFRE version 2: voir et traiter 600 milliards de mots
Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmati...
Saved in:
| Main Authors: | , |
|---|---|
| Format: | Article |
| Language: | Spanish |
| Published: |
Universidade Federal de Santa Catarina
2014-12-01
|
| Series: | Texto Digital |
| Online Access: | https://periodicos.ufsc.br/index.php/textodigital/article/view/35944 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1850048802633809920 |
|---|---|
| author | Etienne Brunet Laurent Vanni |
| author_facet | Etienne Brunet Laurent Vanni |
| author_sort | Etienne Brunet |
| collection | DOAJ |
| description |
Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus.
|
| format | Article |
| id | doaj-art-31cc92c5bbc64e67b63dcce25b670e75 |
| institution | DOAJ |
| issn | 1807-9288 |
| language | Spanish |
| publishDate | 2014-12-01 |
| publisher | Universidade Federal de Santa Catarina |
| record_format | Article |
| series | Texto Digital |
| spelling | doaj-art-31cc92c5bbc64e67b63dcce25b670e752025-08-20T02:53:51ZspaUniversidade Federal de Santa CatarinaTexto Digital1807-92882014-12-0110210.5007/1807-9288.2014v10n2p7522871GOOFRE version 2: voir et traiter 600 milliards de motsEtienne Brunet0Laurent Vanni1Université de Nice Sophia AntipolisUniversité de Nice Sophia Antipolis Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus. https://periodicos.ufsc.br/index.php/textodigital/article/view/35944 |
| spellingShingle | Etienne Brunet Laurent Vanni GOOFRE version 2: voir et traiter 600 milliards de mots Texto Digital |
| title | GOOFRE version 2: voir et traiter 600 milliards de mots |
| title_full | GOOFRE version 2: voir et traiter 600 milliards de mots |
| title_fullStr | GOOFRE version 2: voir et traiter 600 milliards de mots |
| title_full_unstemmed | GOOFRE version 2: voir et traiter 600 milliards de mots |
| title_short | GOOFRE version 2: voir et traiter 600 milliards de mots |
| title_sort | goofre version 2 voir et traiter 600 milliards de mots |
| url | https://periodicos.ufsc.br/index.php/textodigital/article/view/35944 |
| work_keys_str_mv | AT etiennebrunet goofreversion2voirettraiter600milliardsdemots AT laurentvanni goofreversion2voirettraiter600milliardsdemots |