음성합성 학습에 필요한 음성들은 있지만, Text값이 없거나 음성에 잡음이나 배경음악이 많아서 고민인 사람들을 위한 라이브러리입니다.
예전 글에서 음성파일들을 음성합성모델 학습에 사용할 음성 데이터들로 바꾸는 툴에 대해 소개했었다.
(음성파일들 => 배경음악, 잡음이 제거된 음성파일들 + Text파일)
한동안 쓸 일이 없어서 냅뒀다가 어쩌다 보니 이 레포를 들어가서 보게 되었는데
소스가 맘에 안들기도 하고 라이브러리화 시켜놓지도 않아 쓰기 불편할 것 같아서 갈아엎었다.
큰 틀인 transform 작업, 배경음악 제거, STT작업 등은 유지하고, 소스는 다시 짰다.
pypi에도 올려놓았으니 pip install로 간편하게 사용이 가능하다.
# install library
pip install pafts
https://github.com/harmlessman/PAFTS
사용법은 README에 아주아주아주 자세하게 적어놓았으니, 필요한 사람이 있으면 읽고 쓰시면 됩니다.
주의사항은 꼭 확인하시고 사용해주세요.
라이브러리 이름이 pafts인 이유 : Preprocessing Audio For TTS 앞글자 따서 만듦 ㅎㅎ
'프로젝트 > 음성합성(tts)' 카테고리의 다른 글
구글 클라우드 서비스 사용 이후 꼭 해야 할 것 (0) | 2022.11.09 |
---|---|
캐릭터 보이스 만들기#10-최종결과 (6) | 2022.09.21 |
캐릭터 보이스 만들기#9-google cloud platform (0) | 2022.08.02 |
캐릭터 보이스 만들기#8-coqui-tts (0) | 2022.07.14 |
캐릭터 보이스 만들기#7-중간 결과 (0) | 2022.07.13 |