cipherbliss_blog
Actus de Février 2021
Bonjour monde! Depuis la dernière fois avec la page des Ciphers j'ai eu une semaine assez occupée.
Mardi je me suis rendu dans les locaux de CauseCommune pour l'émission "Libre à vous !" du Mardi où j'ai pu causer avec Madix, Isabella Vanni, Luk, Étienne, Vincent, et d'autres chouettes gens de l'April et de la radio 93.1 FM.
https://www.april.org/libre-a-vous-diffusee-mardi-16-fevrier-2021-sur-radio-cause-commune
On a causé d'actions pro libre dans l'éducation, moi en tant que parent d'élève, et Adrien (aka Neox, gérant du serveur XMPP du Chapril) en tant qu'élève du supérieur dans une fac d'informatique.
Le podcast audio sera bientôt disponible et sa transcription a été faite par Marie Odile, comme pour toutes les émissions de Libre à vous.
On a aussi fait des photos
https://photos.april.org/index.php?/category/364
C'était une très chouette expérience, et on a du écourter au maximum à cause du couvre feu TT
à propos de transcriptions, l'April a récemment publié Libre à lire point org qui regroupe tous les textes de l'émission, je me disais qu'il devait bien exister des outils libres pour faire de l'aide à la transcription, depuis bien avant que Mozilla sorte CommonVoice. En effet il en existe des tas, c'est juste qu'ils sont pas bien faciles à faire fonctionner.
Donc j'en ai essayé quelques uns en faisant pousser ma barbe, jusqu'à trouver un qui soit en mesure de faire fonctionner sa démo selon sa propre documentation.
J'ai pioché un exemple avec une lib en python nommée Vosk et soudain, miracle, ça fonctionnait! et il y avait des modèles de données audio en Français disponibles. J'ai donc tenté le coup sur un fichier audio de quelques secondes où les gens parlaient très clairement et le résultat était vraiment pas mal, pour très peu de code à faire.
J'ai donc entrepris de publier un dépôt git que tout le monde pourrait installer un peu plus facilement que ce que j'ai eu à faire. il suffit de suivre le guide du Readme, qui s'affiche sur l'accueil du projet:
https://forge.chapril.org/tykayn/transcription
Le but du jeu étant de faire ceci:
mettre les fichiers audio et vidéos dans un dossier en vue de les transcrire.
lancer un script.
et hop, c'est bon
on obtient un fichier texte de la transcription pour chacun des fichiers sons ou vidéos demandés, dans des formats texte simple, texte précédé par une info minute et seconde, et vrai fichier sous titre .srt à ajouter dans une vidéo.
J'ai pu comme ça filer un coup de main à Marie Odile pour une émission Décryptualité,
puis en causant sur IRC il y a eu aussi Khrys de Parinux qui bosse avec d'autres gens à transcrire à la mano des conférences de la FFDN, par exemple celles de Benjamin Bayard, le plus célèbre des "vieux con des Internets".
une fois qu'on a installé le truc par la magie d'un git clone et d'un make ça marche plutôt pas mal pour faire une bonne base de travail et gagner plein de temps.
Mon script de conversion est documenté en français et sous licence libre AGPLv3, afin de demeurer libre.
Je l'ai testé sur [[https://peertube.cipherbliss.com/videos/watch/8a4bd1d7-f2f5-4773-af75-8f036a65c3f3][ma vidéo de démonstration des ebook et mis en ligne le résultat du sous titrage automatique]], l'idée générale est pas trop mal rendue dans les transcriptions, mais beaucoup de mots que j'ai utilisé dans cette vidéo sont pas évident à comprendre pour le bouzin. Rien que MarkDown ou Chapril ça donne des remplacement marrants :D
Le script ne distingue pas encore les différentes personnes qui parlent mais quelqu'un sur mastodon bosse sur le sujet et on se cause tous les jours.
Breffe, ça pourrait vous être utile ce petit outil de transcription. En tous cas, pour l'équipe de la radio (et les gens qui apprécient d'avoir des logiciels libres faisant dans l'accessibilité à toutes les déficiences, et particulièrement celles où on a besoin de lire) ça vaut son pesant d'or ce genre de truc!
Le gros défi étant de rendre le truc lançable par des gens qui ne sont pas à l'aise avec la programmation. Rien que lire le mode d'emploi est un défi :D
J'aimerais rendre le truc aussi simple à utiliser qu'Etcher l'est pour graver un iso.
Mais ça c'est pas pour tout de suite. Je dois me pencher pour faire avancer Framadate.
En attendant, aujourd'hui a été publié officiellement l'ouverture du service https://mobilizon.chapril.org pour s'organiser de la plus intime raclette à la plus grande manif internationale et autres entre deux en visio. Parinux utilise Mobilizon pour ses soirées hebdo du jeudi et plein de gens aussi, comme les collectifs chatons, les gens de framasoft, et certains gens font de l'import massif depuis d'autres sources d'agendas en ligne.
https://www.chapril.org/IMG/arton45.jpg?1607689105
Donc vouala, pas mal de trucs et j'avance doucement sur mes lectures.
Coucou "science et pseudo science du 1er trimestre 2021", ainsi qu'un autre sur Ada Lovelace, "La beauté des nombres").
à bientôt les cocos.