但并不擅长推算文字转WAV音频