@@@@A. 获取语言学数据的方式有很多@@@@———大到在某个国家进行精心策划的密集的实地考察,小到在家里的沙发上对自己的母语进行不经意的思考。@@@@@@@@B. 在各种情况下,都需要有人扮演语言数据源的角色,我们称之为资料提供者。@@@@比较理想的资料 提供者是以某语言为母语的人,他们说的话可以用来分析,也可以提供一些关于该语言的其他信息(如翻译,正确性评价或者用法判断等)。@@@@通常,在研究自己的母语时,由语言学家自己扮演语料提供者的角色,依靠自己的直觉判断所说的话是否产生歧义,可接受度或者其他特性。@@@@这种方法非常便利,所 以得到了广泛应用,也被认为是生成式语言研究的规范。@@@@但是语言学家个人的判断通常有些不够确定 的或者与其他语言学家的判断发生冲突,这时,就需要表述方式更加客观的信息源,这时可以让非语 言学家来充当语料提供者。@@@@后一种方法在研究外语或者儿童语言的时候,都是必不可少的手法。@@@@@@@@C. 选择语料提供者时必须考虑到多种因素:研究对象是单一说话人 (这种情况在语言从来没有被 描述过的时候非常常见),两个互相交谈的人,还是一小群或者一大群人?@@@@年龄、性别、社会背景以及其 他的身份因素也非常重要,因为这些因素可以影响语言的使用。@@@@谈论的话题与社会环境的特点(比如谈 话的正式程度)也是密切相关的,语料提供者的个人特点(比如讲话的流畅度和连贯性)也非常重要。@@@@对于更大规模的研究而言,要仔细考量采样的方式,而且在各种情况下,都必须要确定到底使用哪种研 究方式。@@@@@@@@D. 目前,研究人员经常采用录音方式。@@@@这使得语言学家的论断得以验证,也可以使这些理论更加 精确(难懂的话语可以重复收听)。@@@@但是要获得自然的高质量的录音数据并非易事。@@@@当人们知道在录音 时,他们说话的方式就不正常,而且录音的音质也可能很差。@@@@所以人们研究了各种录音方法来减少“研 究人员的悖论”(如何研究人们在非研究状态下的行为方式)。@@@@有的录音是在被录音人不知情的情况下 完成的,遮掩法也更有可能获得非常自然的数据,尽管我们也许会面临道德层面的反对。@@@@另外,我们也 可以尝试使说话人忘记录音这回事,比如把录音机摆放在视线之外,或者使用无线麦克风。@@@@有一种技 术很有用,就是引入一个讲话人可以快速进入的话题,然后刺激其以自然的方式讲话 (比如询问老年 人关于他们家乡的时代变迁)。@@@@@@@@E. 可是,录音带并不能解决所有的语言学问题。@@@@录出来的话时常含糊不清。@@@@所以,只要有可能,这 些录音就会伴以研究人员的书面评价,这些评价涉及参与者的非口头行为以及总体的谈话环境。@@@@比如 说,一个面部表情可能会大大改变所说的话的含义。@@@@录像可以大大避免这些问题,但是录像也有一些 局限性(镜头并不能拍到每个角落)。而且文字记录也总是受到研究人员的附加评论的影响。@@@@@@@@F. 语言学家也大量使用结构化访问。在这种访问中,他们可以系统地让语料提供者说出一些话来 描述某些动作、物体或者行为。@@@@有了双语的语料提供者或者通过使用翻译,才有可能使用翻译技术(“在你的语言中是如何讲‘桌子’啊?”)。@@@@使用访问表格和问卷可以在短时间内涵盖很多语言点。@@@@通常, 研究人员只想获得关于某一个变量的信息,在这种情况下,可以使用一套划定范围的问题,比如,可以通过问某些问题来引导语料提供者说出某些话,从而了解某些发音上的特点。@@@@也有一些直接的引导 手法,如让语料提供者填空(如,我 一一一 看见一辆车),或者给他们提供错误的答案让他们修正(可以说 “我不看见”吗?)。@@@@ @@@@G. 语言库是一种比较有代表性的语言样本,它被汇编出来的目的就是用于语言学研究。@@@@语言库可以使语言学家公正的评价语言使用频率,而且也可以为不同的研究人员提供数据。@@@@语言库的范围和大小都是可变的。@@@@有的语言库把各种文字整理出来,试图覆盖语言的全部;而其他的语言库则非常有针 对性,只提供具有某些语言学特点的材料。@@@@语言库的大小取决于各种实际因素,例如有多少时间可以 用来收集、处理和储存数据。@@@@有时候要把一段几分钟的谈话精确地记录下来可能需要几个小时,而有 时候几个语言学数据就足以验证一项语言学假设。与之相反的是,大型研究项目的语言库可能包含几 百万个单词。@@@@一条重要的原则是,所有的语言库,不论大小,它的涵盖范围都是有限的,所以一定需要一些数据的补充,这些数据可以通过自行思考或者实验方法从母语讲话者的自我思考中获得。@@@@