虽然很难真的去分辨强弱文字转WAV音频