File "C:\Users\82109\anaconda3\envs\coqui_tts\lib\site-packages\torch\functional.py", line 604, in stft
input = F.pad(input.view(extended_shape), [pad, pad], pad_mode)
RuntimeError: Argument #4: Padding size should be less than the corresponding input dimension, but got: padding (256, 256)
at dimension 2 of input [1, 10, 22]
나의 경우 음성 합성을 할 때, embedding과정에서 이러한 오류가 발생했다.
https://github.com/NVIDIA/tacotron2/issues/113
위의 issue를 참고해서, 원인을 파악해 보았더니 원인은 매우 짧은 wav파일들 때문에 padding에 오류가 생긴 것 같다.
오류가 나는 %와 진행도를 바탕으로 오류가 나는 wav파일을 찾아보니, 그 파일의 길이가 0.0004초였다..
전체 wav파일 중 극단적으로 짧은 wav파일들을 삭제하고 다시 embedding을 진행하니, 위와 같은 오류가 발생하지 않았다.
'오류노트' 카테고리의 다른 글
[flutter] 플러터로 apk빌드 후 디바이스에서 실행 시 인터넷 연결이 안되는 오류 (0) | 2022.11.30 |
---|---|
현재 브랜치 'master'의 푸시가 거부되었습니다. 푸시 전 원격 변경 내용을 병합해야 합니다. (0) | 2022.11.16 |
OSError: [WinError 1455] 이 작업을 완료하기 위한 페이징 파일이 너무 작습니다. (0) | 2022.06.24 |
[python] BrokenPipeError: [Errno 32] Broken pipe (0) | 2022.06.14 |
[python] ModuleNotFoundError: No module named (0) | 2022.06.10 |