目的是以明显的地域更清晰地划分出来文字转WAV音频