Éditorial : création de notre base de données du cinéma d’animation.

Après l’éditorial d’hier, voici venu le temps de vous expliquer en détails ma démarche pour la nouvelle section du site : la base de données la plus exhaustive possible des films d’animation sortis en France. Une démarche qui, comme vous allez le lire, a été pleine de questions, dont certaines se posent encore aujourd’hui, mais qui a été et continue d’être une source d’excitation, un peu comme un enfant qui est impatient d’être au jour de Noël pour découvrir ses cadeaux…

Le texte ci-dessous est bien plus long de ce dont j’ai l’habitude de vous proposer en temps normal. Pour une fois, je ne me suis pas arrêté à ce “détail”, préférant m’exprimer le plus largement possible dans tous les aspects que je trouve intéressants et qui se devaient d’être traités : définir ce qu’est un film d’animation, quantifier la base et s’assurer de la fiabilité des données. Je vais essayer d’être le plus clair et pertinent possible dans mes propos, mais si ce n’est pas le cas mon adresse postale est disponible sur la page de contact pour m’envoyer des orties !

C’est parti !

De la nécessité de définir ce qu’est un film d’animation…

C’était la première, et la plus dure, étape à réaliser, celle qui devait définir ce qu’est, pour nous, un film d’animation afin de recentrer correctement notre ligne éditoriale mais aussi pour ne pas s’éparpiller dans la création de cette base de données.

S’éparpiller? Oui, effectivement : comment faire la différence entre films d’animation et effets spéciaux dans certains films? Je m’explique avec un exemple concret et le plus récent. Le long-métrage Minuscule 2, les mandibules du bout du monde, dont nous avons partagé la bande-annonce le 21 juin dernier, est considéré comme un film d’animation. Cela peut se vérifier partout sur le net : AlloCiné, UniFrance, Telerama, Télé-Loisirs, et bien d’autres… Mais voilà, au risque de surprendre beaucoup de monde, nous ne considérons pas ce film comme un film d’animation. Oui, j’ai fait une erreur avec la publication de cet article. Si Minuscule 2 est un film d’animation, pourquoi Le seigneur des anneaux de Peter Jackson n’en est pas un? Je veux dire, il y a un maximum de personnages en images de synthèses, c’est donc de l’animation, non?… Alors oui, les personnages principaux sont en prises de vues réelles. Certes. Donc prenons un autre exemple avec Alice comedies vol. 2, une compilation de courts-métrages : animation. BAM ! Pourtant son personnage principal est en prises de vues réelles ! A contrario du Livre de la jungle version 2016 où tout est en 3D sauf… Mowgli, le personnage principal. Pourtant l’animation n’apparaît nulle part dans son genre. Des exemples comme celui-ci il y en a à la pelle. Vous en voulez un dernier? C’est gratuit : Les Schtroumpfs de Raja Gosnell, animation, mais Pierre Lapin, pas animation. Alors? On en perd notre latin :

Dans mes exemples, je me suis basé sur une seule source : AlloCiné. En se basant sur d’autres sources, les résultats ne sont pas les mêmes. Des imbroglios cités ci-dessus ne se retrouvent pas forcément ailleurs pour ces films, mais pour d’autres oui. Du coup j’ai voulu en savoir plus directement à la source : au CNC (Centre National du Cinéma et de l’image animée, mon Dieu que je déteste ce nom). Le verdict est le même : Alice comedies vol. 2 est genré en “Animation”, contrairement au Livre de la jungle qui lui est dans “Aventure”. S’il y a une logique, il faut que quelqu’un nous l’explique. Parce que c’est franchement compliqué de s’y retrouver…

Toutes ses recherches m’ont amenées une réflexion qui a tout fait s’écrouler : qui genre les films? Question idiote sûrement pour la plupart d’entre vous, professionnels du cinéma, mais elle mérite d’être posée. Une simple recherche pour savoir comment obtenir un Visa – le précieux sésame qui permet de diffuser le film au cinéma via une autorisation administrative – nous donne la réponse : en remplissant l’un des formulaires mis à disposition par le CNC, le distributeur doit choisir lui-même le genre de son film :

Voilà comment un film peut être genré en animation, et l’autre d’à côté qui présente pourtant de grandes similitudes, ne l’est pas. C’est le distributeur qui choisit lui-même le genre, très certainement en fonction de sa politique de diffusion. Pierre Lapin sera trop considéré pour enfants alors que c’est une aventure familiale? Hop : fiction. Ce n’est qu’un exemple, ce n’est qu’une extrapolation, je ne dis pas que c’est mal que ce soit le distributeur qui choisisse – mon propos ici est de mettre en lumière le fait que nous avons chacun notre vision des choses et que, par conséquent, il est impossible d’avoir une classification pertinente à tous les niveaux -, mais le résultat est quand même un joli bordel.

Comment s’y retrouver? Au début nous étions parti sur une règle simple : si le ou les personnage(s) principal(aux) sont en animation, alors c’est un film d’animation. Mais cela posait un problème majeur : il fallait apprendre à définir, parfois de façon arbitraire, comment catégoriser les personnages en principaux et secondaires. Autre possibilité : définir un pourcentage des séquences animées dans le film. S’il dépasse un certain seuil, c’est un film d’animation. Là aussi deux problèmes majeurs : le travail est gigantesque et certaines séquences sont en animation ET en prises de vues réelles. Pas terrible. Nous avons donc créé notre propre règle : si ce n’est pas du full animation, ce n’est pas un film d’animation. C’est court et efficace mais à double tranchant tout de même : d’un côté cela simplifie la “sélection”, mais de l’autre on se prive de chouettes films comme Bob l’éponge. Sur les 952 films référencés par mes soins à date, il y a quand même une ou deux exceptions à cette règle, notamment avec WALL•E et ses très courtes séquences avec des humains.

… en passant par l’étape incontournable de la quantification des données…

Maintenant que notre définition personnelle du film d’animation est claire (enfin, on l’espère), il a fallu que je me pose d’autres questions dont j’ignorais l’existence quand j’ai commencé à créer cette base de données il y a plus de deux ans maintenant.

Vous le savez, j’ai lancé la timeline en octobre 2012. Au départ elle n’était pas divisée en quatre parties comme elle l’est actuellement. Une seule timeline, c’était beau et cela facilitait les recherches ! Mais c’était aussi très lourd : à chaque fois que je rajoutais une fiche, la timeline était en mesure de faire crasher les serveurs de Tiki-Toki, l’hébergeur. C’est d’ailleurs sous leur conseil que j’ai divisé la timeline en plusieurs parties – à contrecœur tout de même -, le nombre croissant de projets animés n’aidant pas à la laisser fluide : 251 de 1926 à 1999, 300 de 2000 à 2009, 456 de 2010 à 2019 alors que l’année n’est pas terminée et déjà 20 projets datés de 2020 à 2022 ! Pfiou… Il est parfois difficile de tout suivre, même pour moi avec une veille presque quotidienne.

C’est quand j’ai pris la décision de diviser la timeline que cela aurait dû me mettre la puce à l’oreille. Les sorties vont bon train et leur nombre continue de croître alors si séparer une simple timeline est obligatoire pour ne pas tout faire sauter, comment aborder la création d’une base de données avec un nombre si important de films? C’est une question qui n’a pas de sens pour un site professionnel comme AlloCiné ou encore Première parce qu’ils doivent rire en imaginant “que” 1 000 films dans une BDD, mais je débute de mon côté ! Quelles méthodes vais-je employer pour être le plus efficace? Le site tiendra t’il la charge si j’héberge tout le contenu moi-même comme j’en ai le souhait? Un maximum de questions qui en appellent de façon plus générale une seule : combien pèse une fiche de film?

Pour tester la faisabilité du projet, j’ai essayé de quantifier au mieux la masse de données à importer : visuels (affiches et images) et vidéos (bandes-annonces, extraits, featurettes). Même si j’ai pu extraire une moyenne du nombre de visuels et de vidéos, il me manquait une donnée essentielle : le poids d’une vidéo, et donc son format… J’ai pris une vidéo que j’ai convertie dans tous les formats possibles, en comparant la qualité des images, cherchant le meilleur compromis entre qualité et poids. Le format qui est ressorti est indéniablement le H.264, même si le AV1 me fait quand même de l’oeil. Cependant le timing de ma base de données n’est pas le bon puisque je compte la mettre en ligne au public pour Noël 2018 et l’AV1, plus léger et open source, ne sera définitivement pas disponible avant mi-2019. Le H.265, successeur du H.264, n’est quant à lui pas soutenu par de gros acteurs comme Mozilla et Google. Ces deux visuels (extraits du topissime caniuse.com) qui détaillent les navigateurs et si le format est supporté (ou non) ont fini de me convaincre :

Donc pour quantifier les données j’ai fait un test en prenant les vidéos que je voulais mettre en ligne pour une partie des films sortis en 2017, converti chacune des vidéos avec le même preset de traitement dont j’étais le plus satisfait et les résultats sont… variables. Jugez plutôt :

En faisant la moyenne générale j’obtiens 43 Mo pour une vidéo H.264. En extrapolant sur les 952 films et avec une moyenne de 9 vidéos par film, le poids total de la base de données hors visuels est estimé à 368 Go. C’est en comptant large puisque plus on remonte dans le temps, plus les vidéos sont difficiles à trouver voire inexistantes, et plus on se dirige vers le futur plus les vidéos n’ont pas encore été dévoilées. Je considère que cette largesse inclura le poids des visuels des fiches mais aussi des actrices/acteurs. Comme je l’ai expliqué dans mon éditorial de la veille, les 500 Go avec les ressources garanties pour la bande passante ne seront donc pas superflus pour tout accueillir dans de bonnes conditions.

… pour terminer en s’assurant de la fiabilité des données.

J’attaque ici la partie la plus complexe de cette base de données. Je ne veux pas me contenter d’aspirer des sites comme AlloCiné, IMDb et consort… Surtout que des outils existent pour réaliser le travail automatiquement, ce que j’ai découvert au départ. Une seule journée peut largement suffire à monter un site de base de données. Non, je veux vérifier le plus possible l’exactitude des informations que je vais vous proposer. C’est très important ! Comme les deux précédentes étapes, j’ai eu, là aussi, un maximum de problèmes à résoudre et des constats, parfois très surprenants, à faire.

Au départ, j’étais comme tout le monde, à fond sur la profondeur colossale de la base de données d’IMDb, le site américain numéro 1 mondial dans sa catégorie. Effectivement, il y a de l’information à la pelle, une véritable aubaine ! Chouette ! En réalité, j’ai fini par abandonner cette source parce que je me suis rendu compte qu’il manquait un paquet de fiches, notamment les programmes de courts-métrages que les distributeurs diffusent en France, et que certaines informations étaient fausses, voire complètement mensongères. Pour tout vous dire, la colonne IMDb était encore présente sur mon tableur jusqu’à fin février de cette année :

Comme vous le voyez sur l’image, la base de données s’appuiera sur deux sites différents, hors IMDb : AlloCiné et CBO Box Office (mon coup de cœur pour la fiabilité des informations et leur professionnalisme). Parce que oui, chaque fiche pourra vous renvoyer vers les fiches respectives sur ces sites. Je ne veux pas que le passionné qui visite mes pages prenne les informations pour argent comptant, surtout que mes fiches seront moins complètes que sur les sites cités précédemment. Je pense vraiment que ce sera la force de cette base de données : la possibilité pour l’utilisateur de comparer et vérifier précisément ce que je raconte.

C’est un fait : plus je remonte dans le temps, plus les informations sont difficiles à trouver. Certains détails sont compilés selon plusieurs sources, mais parfois il y en a qu’une seule alors comment savoir si cette unique source est dans le vrai? Pour pallier à ce problème, je me suis dit qu’une recherche en profondeur, directement aux sources, serait un atout indéniable. Alors je me suis mis à contacter TOUS les distributeurs, nouveaux comme anciens quand c’est encore possible, pour tenter de leur soutirer des données en me concentrant sur… les dossiers de presse ! Pour celles et ceux qui ne le savent pas, pour chaque film qui sort, son distributeur met à la disposition de la presse un dossier, numérique ou non, qui récapitule un maximum d’informations sur le long-métrage : fiche technique, intention du réalisateur, fiche artistique, des anecdotes, des interviews, etc. Le contenu est variable d’un dossier à l’autre vu qu’ils sont tous uniques mais ils comportent tous au moins une fiche technique, mon Saint Graal !

Je collectionne les .PDF des dossiers de presse depuis le début parce qu’ils ont pour eux la pertinence des informations vu qu’ils ont été réalisés pour les sorties au cinéma. Dans cette collectionnite aiguë, certains distributeurs se sont coupés en quatre pour me les retrouver dans leurs archives “avec la lampe torche” comme certains ont pu me l’évoquer. Vraiment, sans leur aide (je fais notamment allusion à Folimage et Cinéma Public Films) je serais encore loin du nombre que je possède aujourd’hui : près de 600 sur les 952 films référencés. Ces remerciements ne seraient pas complets sans adresser un grand merci à tous les attaché(e)s de presse qui s’occupaient des films il y a plusieurs années et qui ont pu me renseigner et me fournir des documents mais aussi certains blogueurs cinéma comme Matthieu de Disney Gazette (anciennement rédacteur en chef sur CinéCoulisses) et Jordan de Disney Analysis. Enfin, le CNC et son équipe ont été un atout indéniable dans mes recherches !

Mon enquête du net pour tous les retrouver m’a même amenée à retrouver le graphiste d’une vieille affiche… Malheureusement, retrouver des sources pour un film sorti il y a près de 100 ans et difficile, voire impossible. Du coup, s’il n’y a pas / plus de source officielle? Dur de savoir pour vous si c’est fiable. Je vais donc ajouter un indicateur qui vous donnera, sur une échelle de 1 à 5, le niveau de confiance que j’accorde aux informations présentes dans chaque fiche selon les critères suivants :

  • 5 sur 5 = J’ai toutes les données sur le dossier de presse et elles sont confirmées par différentes sources. Ce sont, dans la plupart des cas, des films sortis après 2000 ;
  • 4 sur 5 = Il me manque des données sur le dossier de presse ou je n’ai pas le dossier de presse. Les informations manquantes sont confirmées sur une ou plusieurs sources ;
  • 3 sur 5 = Je n’ai pas le dossier de presse et les données sont partiellement confirmées. Ce sont, dans la plupart des cas, des films sortis avant 2000 ;
  • 2 sur 5 = Des données sont manquantes, la fiche n’est pas complète. Celles présentes sont partiellement confirmées sur une ou plusieurs sources ;
  • 1 sur 5 = Le peu de données à ma disposition n’est potentiellement pas fiable !

Et visuellement, comment cela va rendre?

Vous arrivez au bout de ce long texte alors pour vous remercier de votre patience je suis aujourd’hui en mesure de vous montrer la charte graphique d’une fiche. J’ai pris comme exemple Vaiana, la légende du bout du monde parce que j’adore ce film. Voici le visuel :

Charte graphique d'une fiche de la base de données.

Il vous plaît? Je l’espère en tout cas ! Sachez quand même qu’il a été réalisé en novembre 2017, validé par le créateur du plugin WP Movie Library, mais qu’il est loin d’être définitif ! Il manque encore à implémenter la nationalité du film, le titre original et les éventuels boutons de partages sur les réseaux sociaux. Le budget sera aussi supprimé, du moins pour l’instant, puisqu’il est trop dur à trouver et les informations trop variables d’un site à l’autre. De plus, c’est une information qui n’est jamais ou presque présente dans les dossiers de presse.

Bien évidemment, je suis passé par de nombreuses étapes avant d’arriver à ce design. Celui-ci, que j’adore, est le résultat de plusieurs tentatives plus ou moins réussies, des tests avec d’autres outils de gestion d’une base de données. Mes échecs ont fini par me faire déduire un crédo : les informations que le plus grand nombre cherche doivent être toutes accessibles directement, sans scroll de la souris, avec le moins de clics possible. Pas facile !

Il reste encore beaucoup à faire aujourd’hui. Je compte passer mon temps libre cet été pour terminer de remplir le tableau avec ces, pour l’instant, 952 lignes et faire un nouveau passage de vérification des données. En septembre, si tout se passe bien l’outil cité plus haut sera disponible et j’attaquerais alors la mise en place des fiches. Le but sera de créer toutes les fiches en y ajoutant uniquement l’affiche, le titre, la date de sortie et le distributeur. Histoire de pouvoir naviguer et tester l’ergonomie de l’ensemble. Ensuite, année par année au moins jusqu’aux années 2000, en partant de la plus récente à la plus ancienne, je pourrais remplir les fiches à 100%. Le tout avant la mise en ligne de la base de données qui est prévue pour Noël 2018.

Parallèlement, et ceci est beaucoup moins certain vu le prix que cela coûte, j’aimerais intégrer la timeline au site. L’avantage est indéniable : la timeline se génère avec les données de la base, elle est donc automatiquement mise à jour quand l’on modifie une fiche ! Petit bonus à cet article, voici la charte graphique de la nouvelle timeline intégrée au site :

Charte graphique de la timeline pour la base de données.

En attendant, nous aurons l’occasion de reparler de tout très rapidement ! Et si vous souhaitez continuer le débat de ce qu’est un film d’animation, c’est par ici !

Merci de m’avoir lu et à très vite !

Créateur et rédacteur en chef du site. Passionné de cinéma d'animation depuis ma tendre enfance, j'ai monté le site afin de partager à un maximum de personnes mes découvertes.

6 comments On Éditorial : création de notre base de données du cinéma d’animation.

  • Bonjour Anthony,

    La base de données est un très gros travail et bravo pour l’avoir entrepris. La question de définir ce qu’est un film d’animation est en effet essentielle. Ta réponse me convient parfaitement. L’autre question auquel tu as été confronté concerne les courts métrages. Certains pourront être dans plusieurs programmes différents destinés à la jeunesse. Peut-on à la fois incorporer les programmes et les courts métrages qui les composent. Dernier point important dont tu n’as pas parlé et qui va être essentiel : le types de sorties : festival, cinéma VOD, ou DVD. Pour ce qui est du DVD, BlueRay et VHS, le film est t’il sorti sur tous ces supports et quand? Est-il sorti directement en DVD/Blue Ray sans sortie préalable au cinéma ? (Cas récents Bad Cat / Jun la voix du coeur / My Entire High School Sinking Into the Sea.. .) Est-il sorti au cinéma sans sortie DVD/ Blue Ray? (Cas récents : La grande course au fromage, l’école des lapins…). Est-il uniquement sorti en festival en France comme Ethel et Ernest? Ce serai dommage de se priver de quelques très grands films comme ce dernier film.

    Si besoin, j’ai de l’expérience dans les bases de données et je serai ravi d’apporter une pierre à l’édifice de ce grand travail.

    N

    • Bonjour Noyeux,

      Tout d’abord merci d’avoir pris le temps d’écrire un commentaire. Ensuite, je vais répondre à tes interrogations :
      – J’ai inclus les programmes de courts-métrages qui sont sortis au cinéma en France dans ma base de données. Une fiche sera créée pour chaque programme, mais, et je pense que c’est l’objet de ta question, je ne compte pas créer une fiche par court-métrage. Du moins ce n’est pas pour l’instant.
      – Comme je l’ai annoncé dans l’article, la base de données concerne exclusivement les sortis cinéma en France. Les galettes, la VOD et les festivals ne sont, pour l’instant, pas concernés pour la simple et bonne raison que j’ai déjà du mal à tout suivre seul. Ce n’est donc pas ma priorité. Peut-être plus tard ! Pour reprendre ton exemple d’Ethel et Ernest, il ne sera pas inclus parce qu’une sortie cinéma nationale n’est pas encore envisagée. Nous l’avons vu au festival d’Annecy l’année dernière et en avons fait une critique : https://annecy.focusonanimation.com/critique-ethel-et-ernest-252/

      Tout aide est la bienvenue dans cet énorme challenge ! Et je compte d’ailleurs lancer un appel à l’aide pour retrouver les vieilles éditions des « L’annuel du cinéma » dès les années 70′ parce que l’information y est fiable. La médiathèque la plus proche ne me propose « que » des années 1999 à 2017. Si tu sais ou les trouver en consultation (pas d’achat malheureusement, les finances ne suivent pas), je suis preneur !

      A très vite :)

  • Salut Anthony,

    Merci pour ta réponse. Ton projet m’intéresse et je suis prêt à t’aider comme je le pourrai. Effectivement une base sur les films d’animation sortis au cinéma, cela va être déjà assez chronophage et cela à ma connaissance n’a pas encore été fait.
    Concernant la question des vieux films, le site le plus fiable que je connaisse est cinéressources au niveau de la richesse en informations parfois reprises d’ailleurs dans Imdb et autres sites
    http://www.cineressources.net/recherche_t.php
    Sur ce site, tu as aussi accès à des magazines de cinéma numérisés des années 1910-1920 et 1930
    http://www.cineressources.net/repertoires/repertoire.php?repertoire=PERI&filtre=TOUTES&filtre2=2&filtre3=1&filtre4=1&filtre5=1&filtre6=1
    Autre endroit, pour récupérer des informations : Gallica
    https://gallica.bnf.fr/html/und/presse-et-revues/presse-de-cinema
    De multiples revues et périodiques y sont également consultables en ligne avant la fin de la deuxième guerre mondiale.

    A très bientôt,

    N

    • Je connais ces deux ressources mais pour le premier tu n’as que la liste des revues numérisées, tu ne peux accéder aux .PDF, non? Pour le deuxième, c’est plus la période de l’après seconde guerre mondiale, malheureusement.

  • Dans cinéressources comme dans gallica, tu peux accéder aux PDF (liens en haut) mais cela concerne avant tout les années 1920-1930. La fin des années 1940 et les années suivantes ne sont souvent pas consultables pour cause de droit d’auteur (copyright). Pour accéder au PDF, il suffit de cliquer sur une revue sur le 2e lien de Cinéressources que je t’ai donné puis de cliquer sur la revue, l’année puis le numéro. Il va cependant falloir fouiller pour trouver des articles sur les films d’animation car ici ce ne sont de revues que de cinéma.
    Pour t’aider également, tu peux consulter le premier lien de Cinéressources. En tapant Jean Image, tu peux par exemple accéder à tous ces films , et, avoir les dates des articles de presse. Mais là, les PDF ne sont pas disponibles en ligne.

    • Merci pour tes explications. En fait, les revues qui m’intéressent ne sont pas consultables, c’est donc pour cela que je n’y arrive pas… Dommage ! Je vais continuer à creuser quand même :)

      Pour le reste, avec les dates des articles de presse, je sais aussi que certaines affiches ont été numérisées et je peux en consulter certaines via Cinémage. Tu connais? http://cinemage.bifi.fr/pages/index.php

Laisser une réponse:

Votre adresse email ne sera pas publiée.

Site Footer