通过他一系列的观察文字转WAV音频