可多少能估算出每个人的行动轨迹来文字转WAV音频