MakeDiffSinger

Pipelines and tools to build your own DiffSinger dataset.

For the recommended standard dataset making pipelines, see:

acoustic-forced-alignment: make dataset from scratch with MFA for acoustic model training
variance-temp-solution: temporary solution to extend acoustic datasets into variance datasets

For other useful pipelines and tools for making a dataset, welcome to raise issues or submit PRs.

DiffSinger dataset structure

Dataset tools now have their own repository: dataset-tools.

There are mainly 3 components:

AudioSlicer: Slice your recordings into short segments
MinLabel: Label *.lab files containing word transcriptions for acoustic model training.
SlurCutter: Edit MIDI sequence in *.ds files for variance model training.

Name		Name	Last commit message	Last commit date
Latest commit History 65 Commits
acoustic_forced_alignment		acoustic_forced_alignment
midi-recognition		midi-recognition
variance-temp-solution		variance-temp-solution
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md