仅能放弃一些不宜守护的非重点区域文字转WAV音频