刚才只不过是口头的协议文字转WAV音频