在同一段话语中用两个确定且不定量的词汇文字转WAV音频