RETOUR ACCUEIL BLOG

L’exploitation des articles de presse par l’IA : un défi juridique et économique

AVIS D'EXPERT | Vincent Chamouleau | Publié le 21 Octobre 2024

Médias et communication

Approfondir le sujet

L’utilisation des articles de presse par les acteurs de l’intelligence artificielle générative pour alimenter leurs modèles, sans autorisation ni rémunération, soulève de nouveaux enjeux pour les médias. Cette pratique met en péril leur visibilité en ligne et pose des questions sur la répartition des revenus générés par ces technologies. Entre blocage technologique, batailles judiciaires et partenariats naissants, les éditeurs de presse tentent de protéger leurs droits face à des géants comme OpenAI ou Google.

Les fournisseurs d’intelligence artificielle (IA) générative (OpenAI, Google, Meta, Mistral AI, Anthropic, etc.) exploitent les articles en ligne des titres de presse pour entraîner leurs modèles de langage naturel. Le rédactionnel journalistique représente une véritable mine d’or pour les systèmes d’apprentissage automatique. Les marques de presse sont en effet des sources reconnues et fiables, elles restituent des informations détaillées et proposent des textes dont la qualité et la richesse sont le plus souvent exemplaires. Néanmoins, cette utilisation des articles de presse s’est faite sans le consentement des médias concernés ou de leurs éditeurs. Les acteurs de l’IA ont récupéré leurs articles en ligne grâce à des outils robotisés de scraping et de text mining pour ensuite alimenter leurs modèles d’IA. Jusqu’à récemment, ils n’ont proposé aucune compensation financière en échange de ces contenus qui leur ont pourtant permis de commercialiser des chatbots conversationnels dès la fin 2022.

Le précédent Google Actualités

Au-delà de l’utilisation de leurs contenus sans contrepartie, les acteurs de l’IA générative menacent directement le trafic des sites de presse en ligne. Avec l’apparition des moteurs de réponse en langage naturel comme ChatGPT ou Perplexity, l’accès à l’information sur Internet évolue. Au lieu de rediriger vers des pages web, à l’instar des moteurs de recherche traditionnels comme Google Search, ils traitent les informations et les restituent sous forme de conversation interactive. Pire encore, ils ne citent pas forcément leurs sources. De quoi détourner une partie du trafic, en l’occurrence celui des internautes qui ne vérifient pas les informations fournies par ces outils. Ce qui signifie que, une fois encore, la visibilité de la presse en ligne dépend de plateformes numériques. Une situation qui rappelle les nombreux conflits judiciaires entre les médias français et Google. La presse tricolore, notamment par le biais des syndicats comme l’Apig et le SEPM, s'est battue contre le géant américain pour obtenir une rémunération au titre des droits voisins, accusant Google de profiter indûment de leur travail journalistique pour alimenter l’onglet « Actualités » de son moteur de recherche mais aussi son application Google Actualités.

Les initiatives pour protéger les contenus de presse se multiplient

Cette situation challenge donc les sites de presse qui doivent se protéger d’une utilisation abusive et non-consentie de leurs contenus et faire respecter leur copyright. Aux États-Unis, le New York Times a par exemple démarré une procédure judiciaire contre OpenAI (éditeur de ChatGPT) et Microsoft en décembre 2023, une démarche reprise en mai 2024 par huit journaux du groupe Alden Global Capital. En Europe, les éditeurs de presse peuvent refuser l’utilisation de leurs contenus en ligne via des techniques de programmation web et d’applications qui bloquent l’accès aux robots d’IA (protocole TDMRep). À fin juillet 2024, environ 40% des principaux sites français d’information ont bloqué l’accès aux robots de ChatGPT par exemple.

D’autres acteurs cherchent quant à eux à nouer des partenariats avec les modèles d’IA générative, afin d’obtenir une compensation financière et de s’assurer une visibilité sur ces nouveaux outils qui vont s’imposer dans les usages. En France, l’Apig et la SEPM avaient appelé 25 entreprises d’IA à ouvrir des négociations en juin 2024. En septembre 2024, OpenAI a refusé les pourparlers. En France, OpenAI s’est seulement engagé à respecter le droit des sites de presse de refuser l’utilisation de leurs contenus pour entraîner ses modèles d’IA (opt-out). OpenAI avait déjà noué un accord pluriannuel avec Le Monde en mars 2024 pour légalement utiliser les articles du Monde (hors contenus d'agences de presse et photos) pour entraîner ses modèles d'IA et alimenter les réponses de SearchGPT (une future version de ChatGPT, intégrant des fonctionnalités de recherche en ligne en temps réel). Ce partenariat s’inscrit dans une stratégie mondiale du géant de l’IA, qui développe un réseau de médias partenaires via des accords financiers (Condé Nast, Time Magazine, Financial Times, etc.). De son côté, le moteur de recherche Perplexity construit également un réseau de partenaires avec lesquels il partagera les revenus publicitaires qui seront générés par le trafic sur son site web et son application.

POUR APPROFONDIR LE SUJET
L'impact de l'intelligence artificielle dans la presse

Revaloriser l’expertise journalistique et développer de nouveaux modèles économiques

VOIR L’ÉTUDEVOIR L’ÉTUDE

Recevez par email toute l’actualité liée au secteur :

Médias et communication

S’INSCRIRES’INSCRIRE

Vous souhaitez personnaliser votre inscription ? Créez un compte Xerfi

Les données collectées serviront uniquement pour vous envoyer les lettres d'information. Vous pouvez à tout moment utiliser le lien de désabonnement intégré dans chaque envoi. En savoir plus dans notre politique de confidentialité.

Vincent Chamouleau analyse depuis plusieurs années les transformations économiques à l’œuvre dans les secteurs des médias, de la communication et des technologies numériques. Il décrypte les recompositions de ces écosystèmes, marquées par la montée en puissance des plateformes, l’évolution des modèles publicitaires et l’intégration croissante de l’intelligence artificielle dans les chaînes de valeur.

Ses travaux portent sur l’analyse des dynamiques concurrentielles et des modèles économiques des acteurs des médias, de la publicité et du digital. Il propose une lecture stratégique et pédagogique des marchés en éclairant les choix de positionnement, les logiques d’intermédiation, les mutations des usages et les ruptures induites par l’innovation technologique. Cette approche vise à aider les dirigeants et décideurs à mieux comprendre des environnements complexes, caractérisés par une forte intensité concurrentielle, une fragmentation des audiences, des usages et des parcours client.

Diplômé d’un master de recherche en économie et finance de l’Université Lumière Lyon II, en partenariat avec l’EM Lyon et l’ENS Lyon, Vincent s’inscrit dans une démarche d’analyse rigoureuse visant à éclairer les effets des technologies avancées - intelligence artificielle, data, automatisation - sur l’organisation des marchés et les trajectoires de création de valeur à long terme.

Les études de son équipeLes études de son équipe