说如果我们能够按照原先说的文字转WAV音频