我们的想法是先把他隔离开来文字转WAV音频