亦或两个注解都抄录文字转WAV音频