음성합성 학습에 필요한 음성들은 있지만, Text값이 없거나 음성에 잡음이나 배경음악이 많아서 고민인 사람들을 위한 라이브러리입니다.

 

 

 

예전 글에서 음성파일들을 음성합성모델 학습에 사용할 음성 데이터들로 바꾸는 툴에 대해 소개했었다.

(음성파일들 => 배경음악, 잡음이 제거된 음성파일들 + Text파일)

 

한동안 쓸 일이 없어서 냅뒀다가 어쩌다 보니 이 레포를 들어가서 보게 되었는데

소스가 맘에 안들기도 하고 라이브러리화 시켜놓지도 않아 쓰기 불편할 것 같아서 갈아엎었다.

 

큰 틀인 transform 작업, 배경음악 제거, STT작업 등은 유지하고, 소스는 다시 짰다.

pypi에도 올려놓았으니 pip install로 간편하게 사용이 가능하다.

 

# install library
pip install pafts

 

 

https://github.com/harmlessman/PAFTS

 

GitHub - harmlessman/PAFTS: Library That Preprocessing Audio For TTS

Library That Preprocessing Audio For TTS. Contribute to harmlessman/PAFTS development by creating an account on GitHub.

github.com

 

사용법은 README에 아주아주아주 자세하게 적어놓았으니, 필요한 사람이 있으면 읽고 쓰시면 됩니다.

 

주의사항은 꼭 확인하시고 사용해주세요.

 

 

라이브러리 이름이 pafts인 이유 : Preprocessing Audio For TTS 앞글자 따서 만듦 ㅎㅎ