About this project

this project provide tools

locally training audio classify by labels (fine ture wav2vec2)
classify audio files
locally llm fine tune
audio data format
1. file convert
2. file split
3. audio to mel transform
audio analysis
1. multiple speaker split
2. voice pad score

demo

split audio

import config
import utils
import glob

# split details in config.py
# > `max_audio_length_ms`, `format_long_audio_split_name`
# > `raw_audio_path`, `train_format_audio_path`
for i in glob.glob("./public_voice/*"):
    utils.split_long_wav(i)

split multiple speaker

from audio_analysis import multiple_speaker
import config
import utils
import glob
import os

for i in glob.glob(os.path.join(config.train_format_audio_path, "__split*")):
    multiple_speaker.get_speaker_dict(i)

split single speaker and mutilpe

single, overlap = utils.classify_overlap_dicts(dicts)

join all and split

import config
import utils
import glob
import os

single_dicts, overlap_dicts = list(), list()

for i in glob.glob(os.path.join(config.audio_analysis_save_path, "analysis_*split*.json")):
    dicts = utils.load_json(i)
    if len(dicts) > 0:
        single, overlap = utils.classify_overlap_dicts(dicts)
        single_dicts.extend(single), overlap_dicts.extend(overlap)

utils.save_json(single_dicts, os.path.join(config.audio_analysis_save_path, "all_analysis_single.json"))
utils.save_json(overlap_dicts, os.path.join(config.audio_analysis_save_path, "all_analysis_overlap.json"))

split voice clips by dicts

import config
import utils
import os

dicts = utils.load_json(os.path.join(config.audio_analysis_save_path, "all_analysis_single.json"))

utils.split_audio_clips(dicts)

emotion analysis

from audio_analysis import emotion
import config
import utils
import os

dicts = utils.load_json(os.path.join(config.audio_analysis_save_path, "all_analysis_single.json"))

pad_dicts = emotion.get_pad_dicts(dicts)

Project initialises

update valuable label in config.py, you can modify the files default path if you want to.
update llm/llm_fine_tune_data.py if you wanna fine tune llm parts.

Default config

audio parts

label audio file path (default) ./classify/(label_name)/*.wav
raw audio path (default) ./raw
pretrain format audio path (default) ./format
mel caches path (default) ./mel
wav2vec2 model path (default) ./model/wav2vec2-large-robust-12-ft-emotion-msp-dim
audio classify model path (default) ./model/classify
not classify audio path (default) ./unlabeled-classify
classify audio output directory ./classify

Run script

audio classify train

python -m audio_classify.label_train

classify audio

python -m audio_classify.label <model_path> <glob_wav_string>

llm fine tune

python -m llm.llm_fine_tune

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
audio_analysis		audio_analysis
audio_classify		audio_classify
llm		llm
config.py		config.py
readme.md		readme.md
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

About this project

demo

split audio

split multiple speaker

split single speaker and mutilpe

join all and split

split voice clips by dicts

emotion analysis

Project initialises

Default config

audio parts

Run script

audio classify train

classify audio

llm fine tune

About

Uh oh!

Releases

Packages

Languages

LewisGet/cv_pipe

Folders and files

Latest commit

History

Repository files navigation

About this project

demo

split audio

split multiple speaker

split single speaker and mutilpe

join all and split

split voice clips by dicts

emotion analysis

Project initialises

Default config

audio parts

Run script

audio classify train

classify audio

llm fine tune

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages