貌似唯有这个可能才能解释这么离谱的数字文字转WAV音频