所以两个人在工作中更多的是按照各自的路径走文字转WAV音频