通常就是几百次几百次的重复文字转WAV音频