从表面上来看只不过两点文字转WAV音频