现在的问题是能够了解其中详情的人文字转WAV音频