因为他算准文字转WAV音频