Photo Gregorio Pellegrino, Fondazione LIA
[Article rédigé par Gautier Chomel à partir des notes échangées par les participants]
Chaque année le W3C organise une rencontre en présentiel sous le nom de TPAC (Technical Plenary and Advisory Committee). C’est l’occasion pour les participants des groupes de travail de faire le point et de mettre en route les projets de l’année à venir. Dans ce cadre, un Salon de l’édition numérique s’est tenu le 13 septembre 2022 à Vancouver avec des membres de la communauté pour réfléchir et discuter de l’avenir de l’édition numérique. Au cours du salon, les discussions ont porté sur un large éventail de sujets et de préoccupations. Nous vous livrons ici un résumé des grandes lignes de ce salon, établi grâce aux notes diffusées en anglais aux participants des groupes.
Contexte
La version 3.3 du standard EPUB est presque achevée et devrait devenir une recommandation complète du W3C au premier trimestre 2023. Une fois publié, EPUB 3.3 entrera en mode maintenance, ce qui signifie qu’un groupe de travail sera formé pour traiter tout erratum ou problème soulevé après la publication. Cela nous donne l’occasion d’explorer la suite des événements.
Objectifs
Pour la rencontre, la discussion prévue sur quatre domaines a été étendue à cinq pour prendre en compte un besoin émergent concernant la sécurité des publications numériques. Les cinq axes sont les suivants :
- Accessibilité : rendre les publications numériques plus accessibles pour tous les utilisateurs, sur toutes les plateformes.
- Portabilité : rendre les publications numériques portables dans l’espace et dans le temps.
- Possibilité de lecture hors ligne : rendre les publications numériques indépendantes de la connectivité Internet.
- Utiliser les technologies du Web : continuer à moderniser et à développer l’écosystème de l’édition.
- Sécurité : rendre les publications numériques sûres, vérifiables et protectrices de la vie privée des utilisateurs.
Les discussions avaient pour but de déterminer quels domaines pourraient être intégrés dans une nouvelle charte de groupe de travail. La charte est un document d’orientation qui donne une structure à ce qu’un groupe de travail va explorer. En général, on attend d’une charte qu’elle permette au groupe de produire une spécification technique.
Afin d’encadrer et d’organiser les résultats des ateliers, ainsi que toute discussion ou planification future, les participants ont utilisé le cadre GIST pour orienter les discussions sur la charte, ainsi que les idées qui doivent être explorées au début des discussions.
Résumé des discussions
Les discussions se sont concentrées sur les objectifs énoncés, ainsi que sur l’impératif de “rêver grand” pour l’avenir des publications numériques. Les participants ont aussi cherché à identifier le chemin parcouru, ainsi une partie des discussions a porté sur ce qui a été fait dans le passé et sur les défis identifiés dans l’écosystème.
D’autres thèmes sont également apparus au cours de la conversation :
- L’approche des spécifications ne peut plus être “si nous le construisons, ils viendront” ; les spécifications doivent répondre aux problèmes réels des utilisateurs avec des solutions dont le succès peut être mesuré.
- La sécurité, une préoccupation non spécifiée pour le secteur de l’édition.
- Les bonnes pratiques ne doivent pas être confondues avec des standards, plusieurs documents produits par les groupe de travail sont des recommandations de bonnes pratiques qui ne peuvent être considérées comme des standards.
- Il est nécessaire d’améliorer l’outillage, les communications et le développement des compétences.
- On note une évolution des besoins, des attentes et des interactions des utilisateurs.
Groupes de travail
Après une session de discussion plénière concentrée sur les problèmes ou les défis auxquels les participants sont confrontés avec les publications numériques sur le marché actuel, six groupes de travail ont abordé six thématiques et relevé les difficultés rencontrées ainsi que des pistes de solutions envisageables.
Conception de contenus complexes et inclusifs
Le défi de la conception du numérique en tant que forme de lecture à part entière, la conception du contenu et de l’interface utilisateur, ses possibilités.
Par contenu complexe, il est entendu l’affichage de partitions, mathématiques, tableaux interactifs, etc. Les cas d’usage adressés sont les suivants :
- En tant qu’éditeur, je veux produire du contenu avec une mise en page riche qui communique des informations à partir de relations spatiales.
- En tant que lecteur, je veux que les livres scolaires, les manuels d’utilisation et les documents d’entreprise utilisent des standards de publication numérique modernes qui garantissent l’accessibilité et la navigabilité.
Les principales difficultés relevées sont :
- Une pression sur l’accessibilité des documents induite par la mise en œuvre de la directive européenne sur l’accessibilité des produits et des services.
- Des écarts forts entre la conception pour l’impression et la conception pour le numérique sous tendus par le besoin de contrôle de l’auteur et le besoin de flexibilité pour l’utilisateur.
- Des relations spatiales horizontales dans la conception de contenus complexes difficiles à transposer sous la forme de contenu adaptable (reflowable).
- L’éloignement des éditeurs de contenus complexes du standard EPUB au profit de publications hybrides non standardisées.
- L’appauvrissement de l’expertise HTML et XML (MarkUp) au profit de balisages légers (MarkDown).
- L’accessibilité des contenus complexes est passée à travers les mailles du filet.
Les axes de travail proposés sont :
- Importance d’une conception adaptée aux appareils mobiles (il existe des économies où les téléphones restent le principal moyen de connexion et de communication).
- Importance d’impliquer les navigateurs Web comme solutions de lecture.
- Besoins de formation et d’expertise.
Engagement communautaire, communication intersectorielle.
Trois difficultés principales ont été relevées :
- Il apparaît nécessaire que davantage de bibliothécaires participent aux discussions sur les standards de l’édition numérique. Pour cela il est nécessaire de réduire les barrières techniques à l’entrée, en ne s’appuyant pas sur des évangélistes techniques solitaires dans chaque organisation.
- Il reste difficile de faire dialoguer les organismes de normalisation avec l’industrie et vice-versa, ce qui ouvre la porte à des divergences de standards (LTI, Caliper, etc.).
- Il faut aussi favoriser la participation de l’utilisateur final aux discussions sur l’élaboration des standards.
Les axes de travail proposés sont :
- Se concentrer sur l’amélioration des connaissances et de l’engagement (par exemple, des déjeuners et des formations) sur ce qui se passe dans le domaine de l’édition numérique.
- Créer des programmes éducatifs, et de sensibilisation pour former la prochaine génération de professionnels de l’édition (par exemple, dans les écoles qui accueillent des programmes d’édition). Soutenir les programmes d’études numériques et accessibilité.
- Favoriser l’engagement des éditeurs avec les technologies (pourquoi ne participent-ils pas à notre communauté ?). La réalité dans notre secteur est que les nouvelles personnes ne sont pas payées ce qu’elles méritent pour faire ce genre de travail.
- Besoin d’engagement et de travail transversal avec d’autres groupes du W3C.
- Impliquer d’autres acteurs dans l’édition (plateformes comme Wattpad, LMSs, etc.).
Pratiques de numérique d’abord (Digital First).
L’organisation de la production sur le principe du Digital First met en avant la capacité des livres numériques comme base pouvant produire plusieurs versions à partir d’un même fichier, en fonction du contexte.
Les difficultés rencontrées sont les suivantes :
- Le feuilletonnage (Serialization en anglais), qui consiste à diffuser le contenu en plusieurs parties dans une seule publication.
- L’archivage des ebooks pour une conservation à long terme.
- L’absence de livres numériques capables de s’adapter à l’environnement de lecture électronique et de se présenter sous forme d’une mise en page fixe ou variable.
- L’absence de possibilité de mise à jour de portions de livres numériques (il est nécessaire de produire à nouveau le livre entier)
- Un manque d’interopérabilité et de prise en charge native par les navigateurs web (le lecteur doit télécharger une application supplémentaire).
- L’absence de standards de versionnement des livres numériques ; il est difficile de communiquer les mises à jour aux lecteurs sans savoir s’ils disposent des dernières versions.
Outils et production
Les difficultés rencontrées sont les suivantes :
- Besoin de remédiation d’anciens formats en nouveaux formats, c’est-à-dire nécessité de transférer de grandes quantités de livres anciens dans de nouveaux formats accessibles et durables.
- Manque de partage des meilleures pratiques et outils de production.
- Environnements de création multiples (imprimé et numérique, mais aussi EPUB et Web).
- Manque d’outils grand public de qualité pour créer des EPUB, notamment pour l’insertion de contenus interactifs dans les publications éducatives. La génération d’EPUB est secondaire dans la plupart des outils courants (par exemple, InDesign). Formats natifs compliqués dans les outils de création ; les options sont généralement l’importation/exportation vers le plus petit dénominateur commun.
- Difficultés de gestion des fichiers de grande taille.
Les axes de travail proposés sont :
- Analyser les lacunes des systèmes de lecture, identifier ce qui peut être mis en œuvre.
- Développement d’une spécification pour lier le contenu FXL à la présentation adaptable.
- Il peut être utile de générer des exemples de contenu EPUB pour “montrer” les fonctionnalités.
- Étendre la spécification.
- Simplifier les contenus complexes (les adapter au contexte ou à la plateforme).
- Créer des outils permettant de relier les chaînes d’outils existantes, InDesign à d’autres outils.
- Favoriser l’expertise technique, les premiers flux de travail devraient être HTML ou XML.
Adressabilité, découvrabilité, données.
Les difficultés rencontrées sont les suivantes :
- Mise en relation des œuvres cross-média, nécessité d’utiliser des métadonnées plus robustes pour relier toutes les formes de médias (livres, sites web, films, métavers, etc.).
- Cohérence et normalisation des données, normalisation des données pour assurer leur utilité.
- Identification d’une publication et communication des contenus et des fonctionnalités à l’utilisateur.
- Adressabilité, être capable de se référer à un endroit précis du livre numérique.
- Prévention de l’obsolescence des liens, utilisation d’identifiants décentralisés et de systèmes redondants pour conserver les liens pendant la durée de vie d’un EPUB.
- Des résultats de recherche dans le contenu qui devraient pouvoir être triés et hiérarchisés.
- Cohésion des métadonnées primaires et secondaires, les primaires sont celles générées par les éditeurs, les secondaires sont celles générées par les utilisateurs (objectifs d’apprentissage, avertissements, genre, notes, etc.).
- Respect de la vie privée et de l’identité du lecteur (notamment en combinaison avec l’évolution du modèle de locateur).
- Annotations publiques et privées, les expériences utilisateur proposées restent difficiles à utiliser.
Les axes de travail proposés sont :
- Les localisateurs ont été résolus (progression, EPUB CFI …).
- Suivre le travail sur les annotations pour le Web.
- Traiter la question des versions directement dans les métadonnées des fichiers (signatures) ; communiquer les différences entre les versions au sein de la publication.
- Sur l’archivage des matériaux une proposition d’atelier a été faite en 2019 (portée par Tzviya Siegman, Deborah Kaplan et Ivan Herman), elle peut-être relancée.
- Le contrôle des versions des fichiers et la mise en œuvre doivent impliquer des personnes travaillant sur les annotations (en raison de la perte d’ancrage).
- Développer l’utilisation de Signature.xml et signature numérique.
- S’appuyer davantage sur la correspondance floue (par exemple, pour résoudre les problèmes d’annotations).
- API du système de fichiers, classes de ressources pour les liens.
Droits et distribution
- Le secteur est confronté à une passage d’un modèle d’achat à un modèle de location.
- La gestion des droits rend impossible de vendre le contenu dans le monde entier simultanément.
- Différences logistiques entre le numérique et l’imprimé.
- Les ebooks doivent être achetés et rachetés, ce qui est coûteux pour les bibliothèques.
Le sujet est trop récent pour que des axes de travail soient proposés.
Conclusion et points à retenir
Après la discussion, le groupe a passé en revue les solutions proposées et les domaines d’exploration pour déterminer comment ils pourraient s’intégrer dans l’activité de publication et la planification future. L’un des défis de cet exercice est de déterminer ce qui peut être fait dans le cadre de l’activité de publication, et ce qui nécessite une participation plus large. En outre, certains domaines discutés n’étaient pas des sujets qui, selon nous, pouvaient être intégrés dans des standards techniques. Nous avons organisé les idées en fonction de ce qui peut être normalisé au sein d’un groupe de travail, de ce qui est hors de portée, des domaines dans lesquels nous pouvons collaborer avec d’autres groupes de normalisation Web et de ce que nous devrions explorer dans le cadre de l’activité de publication.
À retenir
Domaines à normaliser :
- Livres numériques pouvant servir plusieurs modalités à partir d’un même fichier, en fonction du contexte. Par exemple, Media Queries, feuilles de style différentes pour fixed layout et reflow.
- La sérialisation, qui consiste à diffuser le contenu sous forme de pièces multiples dans une seule publication.
- Métadonnées au niveau du chapitre. Achetez le paquet, il se met à jour au fur et à mesure que le contenu est publié.
- Standards de mise à jour des contenus.
- Différents niveaux de métadonnées.
- Global, niveau du titre.
- Niveau du chapitre/de l’article
- Flux secondaires (générés par les utilisateurs, médias sociaux, etc.)
- Signature numérique et vérification du contenu
- Utiliser les méthodes de signatures web existantes (HTTPS, TLS), vérifier la source et la propriété.
Hors champ :
- Outillage. Cependant la simplification du processus de production peut rendre l’outillage plus facile (voir la mise en œuvre des livres audio).
- Remédiation des anciens formats.
- Blockchain/NFTs
- DRM
Domaines nécessitants une collaboration au sein du W3C :
- Annotations.
- Adressabilité.
- Archivage.
- Accessibilité.
Domaines à explorer dans le cadre de l’activité d’édition :
- Divergence des standards de publication.
- Communications sur les standards.
- Éducation à la confidentialité et à la sécurité pour les éditeurs.
- Participation des utilisateurs finaux.
- Droits.
Ce qui vient après
Maintenant que nous disposons de domaines à explorer et à exploiter, que se passe-t-il ensuite ?
L’activité de publication prendra les informations dont nous disposons et travaillera avec nos objectifs pour déterminer les éléments de travail qui peuvent en découler et établir une charte. Il s’agira notamment d’examiner les cas d’utilisation, les mises en œuvre actuelles, les analyses des lacunes et les discussions au sein des différents membres de l’activité de publication.
Avant de passer à la phase de rédaction de la charte, nous voulons être sûrs de nos objectifs et de nos résultats. Nous prévoyons de maintenir une communication ouverte sur ce processus, alors restez en contact et nous ferons de notre mieux pour informer la communauté de nos efforts.
Merci à tous ceux qui ont participé, nous apprécions votre temps et votre engagement en faveur d’une discussion ouverte et de la publication de standards. Si vous avez des questions ou des commentaires sur la session ou sur ce rapport, veuillez nous contacter à l’adresse public-publishing-sc@w3.org.