然后我们的人根据这些线索一路追踪文字转WAV音频