他们现在所说的全是已经失去的文字转WAV音频