但他坚信它们使用的都是同一种基础规则文字转WAV音频