他们只能将这些信息传递给文字转WAV音频