毕竟自己的表现很大程度上会给身边的两位文字转WAV音频