不过这俩的研究方向似乎完全不同文字转WAV音频