这还要算上他文字转WAV音频