不可能这样细致没有遗漏文字转WAV音频