也至少得有千百次的历练文字转WAV音频