然后想办法分辨出谁是真的文字转WAV音频