对方的意图应该是不同的文字转WAV音频