他甚至能预见到文字转WAV音频