开始一点点分析彼此之间的对话文字转WAV音频