场景的明暗文字转WAV音频