OpenRefine
Développé par | Google, Metaweb (en) et Antonin Delpeuch (d) |
---|---|
Première version | |
Dernière version | 3.8.2 ()[1] |
Dépôt | github.com/OpenRefine/OpenRefine |
Assurance qualité | Intégration continue |
Écrit en | Java et JavaScript |
Système d'exploitation | Microsoft Windows, macOS et Linux |
Formats lus | TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation et Notation3 |
Langues | Anglais, italien, langues chinoises, japonais et français |
Type | Outil de Wikidata (d) |
Licence | Licence BSD |
Documentation | openrefine.org/docs |
Site web | openrefine.org |
OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.
Historique
[modifier | modifier le code]Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.
Le , est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].
Le , Google a racheté la société Metaweb[3].
Le , Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].
En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.
En , Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].
Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].
Fonctionnalités
[modifier | modifier le code]- Nettoyage de données.
- Manipulation de données, d'un format à un autre.
- Moissonnage de données d'un site web.
- Ajout de données depuis un service web.
- Alignement avec une Wikibase (dont Wikidata).
Références
[modifier | modifier le code]- « Release 3.8.2 », (consulté le )
- (en) Unknown, « Freebase Gridworks 1.0 released! » [html], sur freebase-gridworks.blogspot.com, (consulté le ).
- (en) Jack Menzel, « Deeper understanding with Metaweb » [html], sur googleblog.blogspot.com, Google, (consulté le ).
- (en) David Huynh, « Announcing Google Refine 2.0, a power tool for data wranglers » [html], sur opensource.googleblog.com, Google, (consulté le ).
- (en) Unknown, « Update: Google News Initiative and technical road map » [html], sur openrefine.org, (consulté le ).
- (en) Unknown, « OpenRefine funded by the Chan Zuckerberg Initiative as an Essential Open Source Software for Science »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) [html], sur openrefine.org, (consulté le ).
Voir aussi
[modifier | modifier le code]Bibliographie
[modifier | modifier le code]- (en) Kelli Ham, « OpenRefine (version 2.5). http://openrefine.org. Free, open-source tool for cleaning and transforming data », Journal of the Medical Library Association, ULS (d), vol. 101, no 3, , p. 233-234 (ISSN 1536-5050 et 1558-9439, OCLC 47728400, PMCID 3738091, DOI 10.3163/1536-5050.101.3.020).
Articles connexes
[modifier | modifier le code]Liens externes
[modifier | modifier le code]- (en) Site officiel
- (en) « Manuel sur la page de la School of data de l'Open Knowledge Foundation », sur schoolofdata.org (consulté le )
- « #36 - OpenRefine, "Excel aux hormones" pour nettoyage de données - Patrimoine et numérique » (consulté le )
- Dépôt du code source