但我还是能够准确地认出他们文字转WAV音频