他需要更多的真实动人的材料去改编文字转WAV音频