但他只想通过对话来寻找一些蛛丝马迹文字转WAV音频