拼凑着一个完整的记忆片段文字转WAV音频