我们的重点还是要放在基础设施上文字转WAV音频