至少得有三倍的准备文字转WAV音频