他需要尽可能地收集更多的信息文字转WAV音频