VIVO: Video Analysis for Corpus-based Audio--Visual Synthesis

Matéo Fayet; Diemo Schwarz; Vincent Tiffon

Communication Dans Un Congrès Année : 2024

VIVO: Video Analysis for Corpus-based Audio--Visual Synthesis

(1) , (2) , (3)

1
2
3

Matéo Fayet

Fonction : Auteur
PersonId : 1373069

Sciences et Technologies de la Musique et du Son

Diemo Schwarz

Fonction : Auteur
PersonId : 1362
IdHAL : diemo-schwarz
ORCID : 0000-0002-4160-4420
IdRef : 090170504

Interaction Son Musique Mouvement

Vincent Tiffon

Fonction : Auteur
PersonId : 14979
IdHAL : vincent-tiffon
ORCID : 0009-0005-3468-2825

Perception, Représentations, Image, Son, Musique

Résumé

Audio–visual corpus-based synthesis extends the principle of concatenative sound synthesis to the visual domain, where, in addition to the sound corpus (i.e. a collection of segments of recorded sound with a perceptual description of their sound character), the artist uses a corpus of images with visual perceptual description (colour, texture, detail, brightness, entropy, movement), in order to create an audio–visual musical performance by navigating in real-time through these descriptor spaces, i.e. through the collection of sound grains in a space of perceptual audio descriptors, and at the same time through the visual descriptor space, i.e. selecting image frames from the visual corpus for rendering, and thus navigate in parallel through both corpora interactively with gestural control via touch sensing. We extend here this principle to the analysis of videos constituting the visual corpus, by adding video-speciﬁc descriptors. The artistic-scientiﬁc question explored here based on the realisation of a concrete performance piece is which visual descriptors are suitable for multi-modal interaction and how to integrate them via real-time video data analysis into a corpus-based concatenative synthesis sound system with the aim of creating an embodied multi-modal audio–visual experience.

La synthèse concaténative par corpus audio–visuelle étend le principe de synthèse concaténative sonore au domaine visuel, où en addition du corpus sonore (i.e une collection de segments de son enregistrés accompagnés d’une description perceptive de leurs caractéristiques), l’artiste utilise un corpus d’images statiques avec leurs caractéristiques visuelles perceptives (couleur, texture, détail, luminosité, entropie, mouvement), dans le but de créer une performance audio–visuelle musicale en navigant en temps réel dans ces espaces de descripteurs, i.e. à travers une collection de grains sonores dans un espace de descripteurs audio perceptifs, et à travers un espace de descripteurs visuels, i.e. en sélectionnant des images dans un corpus visuel pour le rendu, et en conséquence naviguer en parallèle au travers des deux corpus de manière interactive par contrôle gestuel tactile. Nous étendons ici ce principe à l’analyse de videos pour contstituer le corpus visuel, avec l’ajout de quelques descripteurs spéciﬁques. La question arts-sciences qui est ici explorée dans le cadre d’une création artistique est quels descripteurs visuels sont adaptés à une interaction multi-modale et comment les intégrer depuis l’analyse de données vidéos en temps-réel dans un système de synthèse sonore concaténative par corpus dans le but de créer une expérience audio– visuelle multi-modale incarnée.

Mots clés

audio–visual concatenative synthesis cross modal perception inter-sensoriality audio and image descriptors

Domaines

Informatique [cs] Musique, musicologie et arts de la scène

Fichier principal

Vivo_Proceedings_JIM-3.pdf (5.45 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Matéo Fayet : Connectez-vous pour contacter le contributeur

https://hal.science/hal-04576894

Soumis le : jeudi 16 mai 2024-11:53:31

Dernière modification le : dimanche 19 mai 2024-03:14:24

Dates et versions

hal-04576894 , version 1 (16-05-2024)

Identifiants

HAL Id : hal-04576894 , version 1

Citer

Matéo Fayet, Diemo Schwarz, Vincent Tiffon. VIVO: Video Analysis for Corpus-based Audio--Visual Synthesis. Journées d'Informatique Musicale, May 2024, MARSEILLE (FRANCE), France. ⟨hal-04576894⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-AMU IRCAM STMS PRISM-AMU SORBONNE-UNIVERSITE SU-SCIENCES AFIM JIM MUSCI INCIAM

0 Consultations

0 Téléchargements

VIVO: Video Analysis for Corpus-based Audio--Visual Synthesis

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager