他没有办法听清楚具体的语句文字转WAV音频