因为其中投资最少的肯定是最适合的文字转WAV音频