表现的是一种长幼有序文字转WAV音频