实际上他在十年之前就已经完成了融合文字转WAV音频