因为他最大的依靠文字转WAV音频