很重要的一步就是首先要将那些有可能从中作梗的人隔离起来文字转WAV音频