我们之前定下的两个方案都很难做到了文字转WAV音频