在动作捕捉技术成熟之前文字转WAV音频