后者似乎就如赵峰的文字转WAV音频