AVIS D'EXPERT | Vincent Chamouleau | Publié le 21 Octobre 2024
Médias et communicationL’utilisation des articles de presse par les acteurs de l’intelligence artificielle générative pour alimenter leurs modèles, sans autorisation ni rémunération, soulève de nouveaux enjeux pour les médias. Cette pratique met en péril leur visibilité en ligne et pose des questions sur la répartition des revenus générés par ces technologies. Entre blocage technologique, batailles judiciaires et partenariats naissants, les éditeurs de presse tentent de protéger leurs droits face à des géants comme OpenAI ou Google.
Les fournisseurs d’intelligence artificielle (IA) générative (OpenAI, Google, Meta, Mistral AI, Anthropic, etc.) exploitent les articles en ligne des titres de presse pour entraîner leurs modèles de langage naturel. Le rédactionnel journalistique représente une véritable mine d’or pour les systèmes d’apprentissage automatique. Les marques de presse sont en effet des sources reconnues et fiables, elles restituent des informations détaillées et proposent des textes dont la qualité et la richesse sont le plus souvent exemplaires. Néanmoins, cette utilisation des articles de presse s’est faite sans le consentement des médias concernés ou de leurs éditeurs. Les acteurs de l’IA ont récupéré leurs articles en ligne grâce à des outils robotisés de scraping et de text mining pour ensuite alimenter leurs modèles d’IA. Jusqu’à récemment, ils n’ont proposé aucune compensation financière en échange de ces contenus qui leur ont pourtant permis de commercialiser des chatbots conversationnels dès la fin 2022.
Au-delà de l’utilisation de leurs contenus sans contrepartie, les acteurs de l’IA générative menacent directement le trafic des sites de presse en ligne. Avec l’apparition des moteurs de réponse en langage naturel comme ChatGPT ou Perplexity, l’accès à l’information sur Internet évolue. Au lieu de rediriger vers des pages web, à l’instar des moteurs de recherche traditionnels comme Google Search, ils traitent les informations et les restituent sous forme de conversation interactive. Pire encore, ils ne citent pas forcément leurs sources. De quoi détourner une partie du trafic, en l’occurrence celui des internautes qui ne vérifient pas les informations fournies par ces outils. Ce qui signifie que, une fois encore, la visibilité de la presse en ligne dépend de plateformes numériques. Une situation qui rappelle les nombreux conflits judiciaires entre les médias français et Google. La presse tricolore, notamment par le biais des syndicats comme l’Apig et le SEPM, s'est battue contre le géant américain pour obtenir une rémunération au titre des droits voisins, accusant Google de profiter indûment de leur travail journalistique pour alimenter l’onglet « Actualités » de son moteur de recherche mais aussi son application Google Actualités.
Cette situation challenge donc les sites de presse qui doivent se protéger d’une utilisation abusive et non-consentie de leurs contenus et faire respecter leur copyright. Aux États-Unis, le New York Times a par exemple démarré une procédure judiciaire contre OpenAI (éditeur de ChatGPT) et Microsoft en décembre 2023, une démarche reprise en mai 2024 par huit journaux du groupe Alden Global Capital. En Europe, les éditeurs de presse peuvent refuser l’utilisation de leurs contenus en ligne via des techniques de programmation web et d’applications qui bloquent l’accès aux robots d’IA (protocole TDMRep). À fin juillet 2024, environ 40% des principaux sites français d’information ont bloqué l’accès aux robots de ChatGPT par exemple.
D’autres acteurs cherchent quant à eux à nouer des partenariats avec les modèles d’IA générative, afin d’obtenir une compensation financière et de s’assurer une visibilité sur ces nouveaux outils qui vont s’imposer dans les usages. En France, l’Apig et la SEPM avaient appelé 25 entreprises d’IA à ouvrir des négociations en juin 2024. En septembre 2024, OpenAI a refusé les pourparlers. En France, OpenAI s’est seulement engagé à respecter le droit des sites de presse de refuser l’utilisation de leurs contenus pour entraîner ses modèles d’IA (opt-out). OpenAI avait déjà noué un accord pluriannuel avec Le Monde en mars 2024 pour légalement utiliser les articles du Monde (hors contenus d'agences de presse et photos) pour entraîner ses modèles d'IA et alimenter les réponses de SearchGPT (une future version de ChatGPT, intégrant des fonctionnalités de recherche en ligne en temps réel). Ce partenariat s’inscrit dans une stratégie mondiale du géant de l’IA, qui développe un réseau de médias partenaires via des accords financiers (Condé Nast, Time Magazine, Financial Times, etc.). De son côté, le moteur de recherche Perplexity construit également un réseau de partenaires avec lesquels il partagera les revenus publicitaires qui seront générés par le trafic sur son site web et son application.
Revaloriser l’expertise journalistique et développer de nouveaux modèles économiques
Recevez par email toute l’actualité liée au secteur :
Les données collectées serviront uniquement pour vous envoyer les lettres d'information. Vous pouvez à tout moment utiliser le lien de désabonnement intégré dans chaque envoi. En savoir plus dans notre politique de confidentialité.
À lire aussi
INFORMATION
xL’étude Xerfi Previsis vous a été transmise par courriel. Cliquez sur le lien disponible dans cet email pour accéder gratuitement à la parution du mois.
Notre équipe met tout en oeuvre pour vous répondre dans les plus brefs délais.
L’ÉTUDE A ÉTÉ AJOUTÉE A VOTRE PANIER
Bonjour
Que pouvons-nous faire pour vous aider ? ╳
Votre assistant virtuel
Bonjour.
Échangez avec notre conseiller virtuelLes informations renseignées ne doivent pas être inappropriées, subjectives ou insultantes.
Merci de ne renseigner aucune information à caractère personnel ou sensible au sens du RGPD sur le chatbot.
POURQUOI UN COOKIE ?Continuer sans accepter >
Le groupe XERFI utilise et stocke des informations non sensibles obtenues par le dépôt de cookies ou technologie équivalente sur votre appareil. L’utilisation de ces données nous permet de mesurer notre audience et de vous proposer des fonctionnalités et des contenus personnalisés. Nous souhaitons ainsi nous assurer que nous fournissons l’expérience la plus informative pour nos visiteurs.
Les données stockées par XERFI ne sont en aucun cas partagées avec des partenaires ou revendues à des tiers à des fins publicitaires. Vous pouvez librement donner, refuser ou retirer à tout moment votre consentement en accédant à notre page de gestion des cookies.
PERSONNALISEZ LE STOCKAGE DE VOS DONNÉES
Vous pouvez librement et à tout moment modifier votre consentement en accédant à notre outil de paramétrage des cookies.