但他们自己非常清楚文字转WAV音频