不过从刚才对方神态和说话的语气来看文字转WAV音频