但是现在面对的是一千只一万只甚至是数百万只文字转WAV音频