当一个二个三个附和的声音渐次出现文字转WAV音频