反复重拍了大概二十多次文字转WAV音频