他还听到了人类的说话声文字转WAV音频