因此藏在人声中的一些低低的谈话文字转WAV音频