我们都必须从中抽取一定的百分比文字转WAV音频