唯一的途径就是使用更多的人手文字转WAV音频