它的规模连辉瑞的十分之一都不到文字转WAV音频