我们只有口头上的协议文字转WAV音频