En aval de la prise de données, il est nécessaire de traiter les captations effectuées et de les organiser en corpus afin de faciliter ensuite le travail d’analyse. Des opérations de numérisation, de montage, de nettoyage des données, de synchronisation peuvent être à réaliser. Veillard (2013) (https://books.openedition.org/editionsmsh/1990) présente les opérations suivantes :
- Numérisation et indexation :
- Numériser / transférer les enregistrements sur l’ordinateur ;
- Donner un nom aux données : l'attribution d'un nom aux fichiers et dossiers contenant des données doit être basée sur une nomenclature pertinente. Cette nomenclature facilite l'exploitation et la réutilisation des données. Ainsi, nous conseillons de créer une structure de dossiers reflétant l'organisation des enregistrements (par classe, niveau, matière...) et de nommer les fichiers de manière à identifier rapidement leur contenu (date d'enregistrement, contexte...)
- Les répertorier dans un tableau (avec leur date de captation, lieu d’enregistrement, durée, mots-clés, etc.) ;
- D’autres actions d’organisation de corpus (ex : « corpus électronique » Leblanc, Ria, Veyrunes, 2013 - https://books.openedition.org/editionsmsh/1959).
Certaines de ces étapes sont décrites sur les sites Corinte (projet ICAR) et de la Cellule Corpus Complexes (équipe ICAR)