似乎均匀的分布在整个第三层文字转WAV音频