也许他应该尽可能减少麻烦文字转WAV音频