根本不能用常理来揣摩文字转WAV音频