这个实验其实就是自己在做文字转WAV音频