它的基础是安全的文字转WAV音频