Le ciblage contextuel dans le domaine dela vidéoOTT (over-the-top) se situe à la croisée de deux grandes tendances du secteur numérique : la croissance rapide de la consommation de vidéo numérique depuis le début de l'année 2020 et la recherche de stratégies permettant de déployer et de développer des campagnes publicitaires sans recourir aux cookies tiers.
Cette affirmation à elle seule suppose un bagage considérable de connaissances — au moins quelques années d’expérience des tendances du secteur. Revenons un peu en arrière pour expliquer comment nous en sommes arrivés là, et ce que nous entendons par « contextuel » dans le domaine de l’OTT.
Quelle est la différence entre l'OTT et la CTV ?
Les termes « vidéo Over-the-top » (OTT) et « télévision connectée » (CTV) sont souvent utilisés de manière interchangeable, ce qui peut prêter à confusion, car ils ne désignent pas la même chose. Le terme « OTT » désigne le contenu vidéo, c'est-à-dire la diffusion en streaming via des applications. Le terme « CTV » désigne le matériel, c'est-à-dire un appareil connecté à Internet permettant de diffuser et de visionner des vidéos sur un écran de type téléviseur. Lorsque nous parlons d'OTT, nous faisons référence à des services tels que Netflix, Amazon Prime Video, Hulu ou Disney+, pour n'en citer que quelques-uns. Lorsque nous parlons de CTV, nous faisons référence à des appareils tels que les téléviseurs connectés, Chromecast, Apple TV, Roku ou diverses consoles de jeux capables de diffuser des vidéos en streaming (par exemple, une PlayStation ou une Xbox). Vous pouvez diffuser des vidéos OTT via un appareil CTV, mais vous pouvez également les diffuser via un mobile ou un ordinateur de bureau, qui ne sont pas des appareils CTV.
Quelles sont les évolutions dans le secteur de l'OTT ?
La tendance au « cord-cutting » n’est pas nouvelle : depuis des années, les téléspectateurs abandonnent progressivement leurs abonnements à la télévision linéaire au profit des services OTT. Mais les mesures de confinement imposées pendant la pandémie de Covid ont accéléré cette tendance, les téléspectateurs disposant de plus de temps pour regarder des contenus vidéo et cherchant des moyens de faire des économies. Au cours de l’année 2020, le temps passé par les téléspectateurs à regarder des vidéos en streaming a augmenté de 44 %. En 2021, les téléspectateurs consacrent encore plus de temps au streaming qu’en 2020, tandis que le temps passé à regarder la télévision linéaire devrait baisser de 7 % par rapport à l’année précédente. En général, ceux qui ont renoncé à la télévision linéaire ne reviennent pas en arrière par la suite.
L'OTT est donc très prisé, et c'est pourquoi 73 % des acheteurs publicitaires ayant acquis des espaces publicitaires sur la CTV cette année déclarent avoir réorienté une partie de ces dépenses de la télévision linéaire vers la CTV. La vidéo numérique (qui inclut les contenus OTT) représentera 56 % de l'ensemble des dépenses publicitaires vidéo en 2021.
{{cta-1}}
Comment fonctionne le ciblage contextuel dans le domaine de l'OTT ?
Le ciblage contextuel diffère du ciblage d'audience en ce sens que ce dernier s'appuie sur des données indiquant les centres d'intérêt, le comportement et les caractéristiques démographiques d'un utilisateur, tandis que le ciblage contextuel analyse le contenu lui-même afin d'adapter les campagnes publicitaires à des environnements pertinents. Avec du texte, le principe est assez simple : un algorithme parcourt les pages à la recherche de mots-clés pertinents pour la campagne. Des solutions contextuelles plus avancées peuvent analyser le texte pour en déterminer le sentiment et le ton — non seulement ce que le langage signifie, mais aussi le sens qu'il transmettrait à un utilisateur humain.
La vidéo nécessite une approche technologique différente. La quantité de texte disponible pour une analyse algorithmique est assez limitée. Il existe certes du texte — les métadonnées et les sous-titres codés, par exemple —, mais pour effectuer une analyse contextuelle dans une vidéo, l’algorithme doit reconnaître des formes et des motifs. C’est extrêmement important pour garantir la sécurité de la marque. Un annonceur peut souhaiter éviter de diffuser sa publicité à proximité d’une scène comportant de la nudité ou de la violence. Une marque de sodas peut vouloir éviter une scène où des personnages discutent de leur intention d’arrêter de boire des sodas. Une marque de voyage peut souhaiter s’associer à une scène de plage ensoleillée — auquel cas l’algorithme devrait être capable de reconnaître une plage ensoleillée.

Cependant, l’analyse contextuelle des images et des vidéos représente un défi technologique bien plus important que celle du texte. Elle nécessite un apprentissage automatique approfondi pour permettre à la technologie de reconnaître des schémas. Des capacités technologiques encore plus avancées sont requises pour analyser le sentiment — afin de déterminer, par exemple, si une scène est comique, tragique ou ironique. C’est là qu’intervient la vision par ordinateur, pour analyser les données et effectuer la reconnaissance d’images. La vision par ordinateur apporte également des gains d’efficacité qui favorisent le développement du ciblage contextuel dans la vidéo, et aide les annonceurs à découvrir des contenus vidéo pertinents et adaptés à leur image de marque, au-delà de leurs sources d’inventaire habituelles et éprouvées.
L'obtention à grande échelle de ces signaux contextuels à partir de contenus vidéo constitue une avancée majeure, car les services OTT — qui sont généralement des environnements fermés — décident eux-mêmes des données qu'ils souhaitent partager avec les annonceurs. L'un des avantages de l'approche contextuelle est que les éditeurs vidéo et les services de streaming pourront partager davantage de données sur leur programmation, sans dépendre des données fournies par leurs téléspectateurs eux-mêmes. Le partage d'informations plus détaillées sur les contenus dans lesquels leurs publicités sont diffusées encouragera les annonceurs à augmenter leurs dépenses en matière d'OTT et de CTV.
En quoi le ciblage contextuel est-il bénéfique pour l'OTT ?
En quelques mots, le ciblage d’audience a toujours constitué un défi dans le domaine de l’OTT, car l’environnement CTV ne prend pas en charge les cookies. L’OTT s’appuie généralement sur les données IP pour le ciblage d’audience, et ces données IP dépendent des signaux émis par l’utilisateur. Le ciblage par adresse IP ne restera pas une stratégie fiable très longtemps : alors que le secteur s'oriente vers l'octroi aux utilisateurs d'un contrôle accru sur la confidentialité de leurs données, nous devons partir du principe que les données IP ne seront plus une option à peu près au moment où Google abandonnera les cookies tiers, en 2023. Le secteur de la publicité numérique aura besoin d'une nouvelle stratégie, et le ciblage contextuel — qui fait déjà partie de la panoplie d'outils des éditeurs et des annonceurs — constitue une solution évidente à ce problème urgent.
Par ailleurs, l’évolutivité du ciblage contextuel OTT vient d’être renforcée par la nouvelle version 3.0 de la taxonomie des contenus de l’IAB, conçue pour la CTV, les podcasts et les applications mobiles, y compris les jeux. Cette taxonomie mise à jour décompose le secteur « actualités » en catégories plus spécifiques (en distinguant notamment les actualités des éditoriaux) et ajoute davantage de catégories « divertissement » pour la CTV. L'objectif est de mieux garantir la sécurité des marques dans la vidéo numérique et de remédier à un autre problème de longue date dans le domaine de l'OTT/CTV : l'absence de consensus au sein du secteur sur la taxonomie des contenus [https://digiday.com/media/building-that-ecosystem-contextual-advertising-begins-to-sprout-in-ctv-ott-ad-markets/].
Les formats publicitaires « in-video » offrent également une opportunité contextuelle majeure : il s’agit de superpositions animées placées sous ou à côté de la vidéo, plutôt que dans le flux vidéo lui-même. Ce format est fondamentalement similaire aux logos et bannières que les téléspectateurs reconnaissent de la télévision linéaire, mais adapté aux plateformes OTT/CTV. Il permet de libérer davantage d’inventaire et d’ouvrir une nouvelle source de revenus pour les éditeurs, sans entrer en concurrence avec les publicités vidéo « in-stream » pour capter l’attention. Lorsqu’un annonceur ajoute une publicité « in-video » à l’une de ses propres publicités dans le flux vidéo, il peut en substance créer un « take-over » vidéo. Utilisées seules, les publicités « in-video » réduisent considérablement les coûts publicitaires sur les plateformes OTT/CTV, car elles ne s’accompagnent pas des coûts de production élevés ni des délais propres aux publicités vidéo traditionnelles.
En conclusion
Le partenaire de ciblage contextuel joue également un rôle dans la collecte et le partage d'informations sur les vidéos. Les URL des vidéos ne transitant généralement pas par le flux d'enchères, le partenaire contextuel doit accéder au CMS de l'éditeur ou de la plateforme afin d'extraire des données contextuelles utiles pour les acheteurs.
{{cta-2}}




