估计在场的绝大部分人文字转WAV音频