面前的两个人是自己这一次实验的对象文字转WAV音频