从一开始的寥寥无几的观众文字转WAV音频