其中有一半时间是在熟悉实验流程先文字转WAV音频