English version /
Version française



PyCoA
(Python Covid Analysis) est un ensemble de code Python™ qui fournit :
- un accès simple aux bases de données sur la Covid19 ;
- des outils pour représenter et analyser les données de la Covid19, comme des séries temporelles ou des cartes.
Cet environnement est pensé pour être accessible à des non-spécialistes : des lycéen·nes qui apprennent Python™, des étudiant·es, des journalistes scientifiques, voire même des chercheurs et chercheuses qui ne sont pas famillier·es avec l’extraction de données. Des analyses simples peuvent être directement effectuées, et des analyses plus poussées peuvent être produites par les personnes habituées à programmer en Python™.
L’outil PyCoA
assure l’accès à plusieurs bases de données et fourni un format standardisé pour les données. Il assure par ailleurs une jointure transparente avec des bases concernant géo-localisation (gestion des noms de pays ou de régions, possibilité de jointures sur des bases avec des description différentes, création de cartes). Ces informations de géolocalisation peuvent par ailleurs être utilisées pour d’autres application en dehors des aspects Covid19.
L’outil PyCoA
est pensé pour être utilisé dans un environnement jupyter, installé localement ou bien sur un serveur distant (comme le propose par exemple google colaboratory ou binder). Cela en simplifie l’installation et assure grâce à la librairie Bokeh
des sorties graphiques performantes avec très peu de lignes de code pour l’utilisateur comme en attestent les quelques lignes de code suivantes et les sorties associées.
import coa.front as cf
cf.plot(where=['France', 'Italy', 'United kingdom'])
cf.map(where='world',what='daily',when='01/04/2020')
cf.hist(where='middle africa', which='tot_confirmed',what='cumul')
cf.get(where='usa', what='daily', which='tot_recovered',output='pandas')
À propos
Physiciens sur des expériences en physique des particules au CERN ou en physique de la matière complexe, habitués à la gestion de big data, nous avons souhaité partager nos compétences en statistiques et gestion de données au plus grand nombre pour ce qui concerne l’analyse de données liées à la pandémie de la Covid19 au travers le monde. L’exploration de données et les statistiques devraient pouvoir aider toutes et tous à mieux comprendre un des phénomènes les plus importants de l’histoire récente.
Pour cela nous proposons le projet PyCoA
, pour Python™ Covid19 Analysis, un outil de statistique qui peut s’utiliser en ligne, avec une interface simple et des schémas de modélisation clairs. La version proposée en ligne peut notamment s’utiliser au travers Google Colaboratory ou de Binder, une infrastructure de notebooks Python™, et ce, sans aucun effort d’installation.
Cela permet en outre un travail collaboratif par le partage de notebooks sur le nuage de google colab
, ce dernier permettant de plus l’utilisation d’une infrastructure de calcul énorme (incluant aussi des GPU pour de futures analyses de deep learning des données Covid19).
Origines
Le projet PyCoA
, initialement désigné CoCoA
, a vu le jour initialement à partir de la participation en avril 2020 à l’hackathon organisé par UltraHack.org.
Retenu en phase final mais non sorti vainqueur, le projet se veut libre et gratuit à code source ouvert. Il a continué d’évoluer depuis et a subi une mise à jour majeure lors du Hackathon Covid19 animé par la Direction interministérielle de la transformation publique en avril 2021.
Son code est public ainsi que les notebooks
et servent de références ou d’exemples d’utilisation lors d’animations ou d’ateliers (lors du Salon Culture et Jeux Mathématiques 2021 ou lors de la Fête de la Science 2021).
PyCoA
: logiciel générique d’analyses numériques en Python
Le projet a été développé à l’origine pour des études épidémiologiques liées à la Covid19. Il pourra cependant être utilisé pour d’autres types d’études.
Ainsi, des analyses comportant des données avec des séries temporelles associées à des variables numériques et géographiques, pourront utiliser PyCoA
. Leurs études seront grandement simplifiées et ceux avec des représentations graphiques claires et précises .
Licence
Le projet PyCoA
est sous licence MIT.
Auteurs
- Tristan Beau - Université de Paris - LPNHE laboratory
- Julien Browaeys - Université de Paris - MSC laboratory
- Olivier Dadoun - CNRS/in2p3 - LPNHE laboratory
Institutions





On parle de nous…
- Sur le site MODCOV19 du CNRS : Modélisation et Covid-19 PyCoa : Python Covid analysis
- Dans le journal Acteurs Publics L’héritage du “Hackathon Covid” passé à la loupe
- Dans les actualités du LPNHE - Laboratoire de Physique Nucléaire et Hautes Énergies (juillet 2021) : Pycoa, un logiciel pour mieux comprendre la pandémie due à la Covid-19
- Dans les actualités de Sorbonne Université (juillet 2021) : PyCoa : un logiciel gratuit d’analyse des données de la Covid-19
- Dans les actualités de l’UFR de physique de Université de Paris (juillet 2021) : «Un logiciel pour mieux comprendre la pandémie»
- Dans les actualités de Université de Paris (juin 2021) : «Un logiciel pour mieux comprendre la pandémie»
- au 22ème salon culture et jeux mathématiques (mai 2021) :
https://salon-math.fr/2021/04/14/pycoa/
- à l’hackathon covid - lutter ensemble (avril 2021) :
https://forum.hackathon-covid.fr/t/3a-pycoa-une-analyse-python-des-donnees-covid-pour-tous/251
- à l’hackathon Data Against Covid-19 (avril 2020) : [