然后从我们的行动位置文字转WAV音频