对他的表述更多在于文字转WAV音频