现场简陋的情况根本没有办法进行处理文字转WAV音频