他之前的猜想是完全没有问题的文字转WAV音频