他只能用自己的文界作为通道文字转WAV音频