음성 합성 데이터 셋 제작 라이브러리

2023. 5. 1. 00:16

예전 글에서 음성파일들을 음성합성모델 학습에 사용할 음성 데이터들로 바꾸는 툴에 대해 소개했었다.

(음성파일들 => 배경음악, 잡음이 제거된 음성파일들 + Text파일)

한동안 쓸 일이 없어서 냅뒀다가 어쩌다 보니 이 레포를 들어가서 보게 되었는데

소스가 맘에 안들기도 하고 라이브러리화 시켜놓지도 않아 쓰기 불편할 것 같아서 갈아엎었다.

큰 틀인 transform 작업, 배경음악 제거, STT작업 등은 유지하고, 소스는 다시 짰다.

pypi에도 올려놓았으니 pip install로 간편하게 사용이 가능하다.

# install library
pip install pafts

GitHub - harmlessman/PAFTS: Library That Preprocessing Audio For TTS

Library That Preprocessing Audio For TTS. Contribute to harmlessman/PAFTS development by creating an account on GitHub.

github.com

사용법은 README에 아주아주아주 자세하게 적어놓았으니, 필요한 사람이 있으면 읽고 쓰시면 됩니다.

주의사항은 꼭 확인하시고 사용해주세요.

~~라이브러리 이름이 pafts인 이유 : Preprocessing Audio For TTS 앞글자 따서 만듦 ㅎㅎ~~

구글 클라우드 서비스 사용 이후 꼭 해야 할 것 (0)	2022.11.09
캐릭터 보이스 만들기#10-최종결과 (6)	2022.09.21
캐릭터 보이스 만들기#9-google cloud platform (0)	2022.08.02
캐릭터 보이스 만들기#8-coqui-tts (0)	2022.07.14
캐릭터 보이스 만들기#7-중간 결과 (0)	2022.07.13

생각 그리기