在他们接受时实际上就清楚了文字转WAV音频