基本忽略了坐在旁边的四位姑娘文字转WAV音频