如果要按境界来算的话文字转WAV音频