以前一切都得实时拍摄文字转WAV音频