Data Library

Les Data Scientists ont tous les algorithmes à portée de main, à quand les données?

Une seule plateforme

Assurer une veille complète sur la donnée disponible est un défi de tous les instants.
À partir d’API et de scrapers nous récupérons automatiquement jeux de données et métadonnées avec lesquels nous alimentons chaque jour notre plateforme. Open Data, data brokers, fournisseurs d’imageries aériennes et satellites, pages web… toute source d’information est passée au crible par nos programmes.

Une donnée hautement qualifiée

Ces métadonnées récupérées des plateformes ne sont pas harmonisées et ne sont pas suffisamment détaillées. C’est pourquoi nos scripts parcourent en masse les données intégrées à notre bibliothèque et en tirent de très nombreuses informations, à la colonne près. Nous pouvons alors classer, ordonner et mettre en valeur les jeux de données grâce à toutes les informations collectées et à notre search engine.

Plus qu’un catalogue, une bibliothèque

Un catalogue se contente de pointer vers une donnée à distance. La donnée est alors parfois complexe à récupérer : temps de téléchargement importants, liens morts, incapacité à visualiser les contenus. Nous téléchargeons donc systématiquement tous les fichiers dans nos serveurs. Nos technologies en visualisation de données permettent alors de parcourir les données quelque soit leur format – tables, données géolocalisées, images, textes.

La Data Library en chiffres

114
plateformes

parcourues quotidiennement

1100
mille

de fichiers recensés

15400
mille

de colonnes qualifiées

fichiers collectés géolocalisés 0

fichiers collectés géolocalisés par nam.R 0

Data Science

Construire une donnée inédite et localisée

Natural Language Processing

Pour extraire des données des fichiers textes de notre Data Library, nous utilisons des algorithmes de Natural Language Processing. Nous avons développé des algorithmes spécifiques d’information retrieval et de named entity recognition. Ils nous permettent de déterminer quels éléments du texte correspondent à quels noms propres de tel emplacement ou lieu. Ces algorithmes s’appuient sur un corpus unique construit par nam.R.

Computer Vision

Pour extraire des informations à partir d’images satellites, aériennes ou terrestres, nous avons développé une expertise en computer vision. Notre technologie repose sur le deep learning.
Nous avons développé une méthode très efficace d’annotation d’images grâce à laquelle nous produisons nos propres bases d’apprentissages.
Ces techniques nous permettent de détecter des éléments comme des voitures ou des piscines sur des images aériennes ou encore de compter des fenêtres sur des photos de façades.

Machine Learning

Nam.R a construit la première approche de machine learning adaptée aux données locales afin d’optimiser l’efficacité et le temps de calcul des modèles développés. Cette approche est effectuée de manière collaborative sur notre plateforme de data-science.

Data Visualization

Explorer nos données à travers les outils de visualisation

Carte 3D

Pour donner un sens à la donnée et la rendre actionnable, la visualiser est un levier indispensable.

Développée en WebGL sur le framework three.js, notre carte 3D intègre l’ensemble de nos données. Véritable SIG 3D, elle permet d’exposer en temps réel les données produites quotidiennement par nam.R et encourage leur utilisation