他们应该也掌握着文字转WAV音频