但这些人显然受过极严格的训练文字转WAV音频