能够最大限度的保留各个有价值的部位文字转WAV音频