已经完全推翻了之前的认知文字转WAV音频