应该是相互的沟通文字转WAV音频