大大增加捕捉难度文字转WAV音频