logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
Menu
mobile logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
21 décembre 2017
A la Une, DAP, Débats autour des data, Dossiers thématiques, News

La plateforme de prépublications arXiv est-elle dévoyée ?

⏱ 3 min

Entretien avec Nikos Paragios, directeur du Center for Visual Computing et professeur de mathématiques à CentraleSupélec au sein de l’université de Paris-Saclay. Comme d’autres chercheurs, il s’alarme de l’utilisation faite de la célèbre archive de prépublications électroniques d’articles scientifiques arXiv.

 

DAP : La communauté de la data science fait-elle un usage abusif d’arXiv,  en y prépubliant à tout va des travaux pas forcément très aboutis ?

Nikos Paragios : En effet, dans la plupart des articles prépubliés sur arXiv dans le domaine de la data science – qui évolue très vite et notamment en deep learning -, la description de l’architecture, qui est la contribution la plus importante, est faite télégraphiquement :  elle n’est pas suffisamment détaillée pour que les travaux décrits puissent être vérifiés comme il se doit. Mais les auteurs ne sont pas les seuls responsables de cette tendance…  Le système universitaire et les agences de financement de la recherche mettent aussi de plus en plus de pression sur les chercheurs pour publier davantage en quantité qu’en qualité. Résultat : ils prépublient des travaux prématurés.

 

DAP : Malgré cela, un article sur arXiv est perçu comme une « semi-publication » :  il peut être cité et bénéficie d’indicateurs de popularité donnés par Google et Google Scholar…

N.P. : Le fait que les papiers sur arXiv puissent être cités n’est pas un problème en soi. Le principal problème est que ce qui est cité n’est pas vérifiable, du moins pas immédiatement. Nombre de papiers mis en ligne sur arXiv ne sont d’ailleurs ensuite jamais publiés dans une revue ou présentés dans une conférence, après évaluation par des pairs en « double aveugle » (les pairs ne savent pas qui sont les auteurs et vice-versa). Les prépublications sur arXiv servent surtout de tampon pour s’arroger l’origine de travaux sur une thématique, bref une sorte de système pour « horodater »  des contenus et méthodes scientifiques. Ceci peut couper l’herbe sous le pied à d’autres chercheurs en train d’accumuler des travaux et résultats plus complets ou plus mûrs sur ces mêmes sujets… Là, cela devient un réel problème !

 

DAP : Pourtant, certains chercheurs, tel le spécialiste français du deep learning Yann Le Cun, estiment que ce système de prépublications sur arXiv est plus efficace que le modèle de publications traditionnel. Qu’en pensez-vous ?

N.P. : Je devrais utiliser un joker là dessus… mais je vais répondre ! Dans le passé, la carrière universitaire et le statut académique des chercheurs étaient évalués sur la base du contenu de leurs publications, une fois évalués par les pairs. Puis nous sommes passés au nombre de publications, ensuite au nombre de fois où elles étaient citées (les fameux indicateurs de recherche), maintenant on prend aussi en compte les prépublications sur arXiv avec les dérives que je viens d’évoquer… La prochaine étape consistera-t-elle à regarder le nombre de followers sur LinkedIn et Twitter ?  Le monde académique perd ses repères, l’évaluation des contributions par les pairs devient obsolète… et la séparation entre des contributions à de vraies idées qui peuvent avoir un impact et à des idées à la mode facilement « diffusables »  devient difficile.

 

DAP : Vous allez plus loin : selon vous arXiv créé de l’inégalité. Pourquoi ?

N.P. : Avec arXiv, il n’y a plus de notion d’anonymat. Or, personne n’est assez stupide pour croire qu’un papier aura le même impact – au moins aujourd’hui- s’il est mis en ligne sous l’étiquette « MIT » (Massachussetts Institute of Technology) ou sous l’étiquette « Université Paris-Saclay ». arXiv prive la communauté scientifique d’un excellent outil pour donner la même chance à tous et enlever l’effet « prestige  institutionnel » pendant l’évaluation : le processus d’évaluation à l’aveugle. C’est le seul moyen d’assurer que des travaux aient l’impact qu’ils méritent, indépendamment de leur origine : auteur, institution, pays…

Propos recueillis par Jean-Philippe BRALY
Termes liés :
  • Data science
  • Deep learning
Retrouver les autres articles du dossier “Débats autour des datas” :
  • Les algorithmes vont-ils finir par nous gouverner ?
  • Les POC sont-elles toujours dans le coup ?
Share:
Posts you'd might like
En attendant l’ordinateur quantique universel…
L’IA teste ses premiers algorithmes quantiques
Les promesses de l’IA quantique
La recherche à l’assaut des deepfakes vocaux
Recyclage : nos déchets sous l’œil de l’IA
Stéphane Canu :
au service de l’IA et de la mobilité de demain
DAP, la newsletter du Data Analytics Post Recevez chaque semaine un éclairage sur les data science

Peut-on laisser un algorithme apprendre tout seul ?

A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.

En savoir plus

ARTICLES RÉCENTS
  • En attendant l’ordinateur quantique universel…
  • L’IA teste ses premiers algorithmes quantiques
  • Les promesses de l’IA quantique
  • La recherche à l’assaut des deepfakes vocaux
  • Recyclage : nos déchets sous l’œil de l’IA

Tout savoir sur…

Le DAP

Comité Éditorial

Partenaires

Équipe


Copyright © Data Analytics Post. Tous droits réservés.

Mentions légales & CGU