Aller au contenu

Portail:Données

Une page de Wikipédia, l'encyclopédie libre.
correlogramme Portail de la Science des données

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data et de la DataViz (Data visualisation)

196 articles sont actuellement liés au portail


Outils informatiques

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflowGraphQLApache NiFi

Jeux de données : Iris (jeu de données)Demande de valeurs foncières

Logiciels : Tanagra RStudioSASSPSSOrangeH2O.ai

Bases de données : MongoDBCassandraCouchDBHBase

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAIApache Airflow

Dataviz

Type de représentation : DendrogrammeNuage de mots-clésNuage de pointsCorrélogramme

Logiciels : Business ObjectsTableau SoftwareQlik

Articles connexes : Carte heuristique