你们会随机匹配到不同的位置文字转WAV音频