似乎很难分清楚谁占据了主动文字转WAV音频