结合之前的照片来分析文字转WAV音频