他们继续跟踪文字转WAV音频