4c 研究的效度和信度2019 PDF

信度的定义:
 穩定度(stability)
 一致性(consistency)
 即对同一件事物进行兩次或以上的测量，其
結果的相似程度。即不同的测验时点下，测
验分数前後一致的程度
信度所指的是可靠性或信任度，指研究的前后一
致性以及研究能在多大程度上重复。测试的信度
越高，学生在测试中所获得的分数将于下一次考
试分数差距不远。
例：可以期待第一次受试的高分者，在下一次的
实测中也会得高分；或许分数不一定相同，但一
定很接近。
 效度指的是测量到的结果反应所想要考察的
内容的程度。
 测量结果和要考察的内容越吻合，效度则
越高，反之效度越低。
 效度表示一切研究的真实性和准确性程度，
它与研究的目标密切相关。
 一项研究所的的结果必须符合其目标才算
有效的，因而效度也就是达到目标的程度
 为了达成研究目标，必须藉由研究工具来获取
所需资料，为此在准备或选用研究工具时，效
度是一个重要的考量因素。
 在定性资料中，可以通过获取资料的忠实性、
深刻性、丰富性和范围，涉及的参与者，三角
互证的程度，以及研究者的公正性或客观性来
分析效度。
 在定量资料中，可以通过细致的抽样、编制适
当的工具，以及对资料进行适当的统计处理，
来提高效度。
例如：
 想要了解教师对校本评估之看法，研究者所需
的包括收集资料的研究工具，以及如何能确保
所获得的资料确实能说明教师真正想法的结论
。
 如果想要了解学生对非洲文化的理解，以非洲
自然地理为测验范围所得分数就不适合用来作
为推理基础。
 一个“真实”的成绩是80分的学生在测验中只
获得60分（说明测验没有效度），但他每次参
加这个测验都得到60分（说明测验有信度）。
 -一个有效度的测验总是会有信度，但是一个有
信度的测验则不一定有效度。
 一个测验测量到它想要测量的东西，那么它就
有效度，但是一个只有信度的测验却一直只测
量到错误的事情，那它就没有效度了。
 在研究的过程中，我们常常会碰到的效度問題
有二个：
 工具效度
 研究效度
 工具效度=工具+效度
 一个测量工具测到它宣称可以测到被研究对象
的某一特质的程度
例如：
 要看一个“国小五年級自然科学习成就问卷”
的工具效度就是要检视其是否能忠实反映被研
究对象的自然科学习成就
 工具效度高代表其测量结果和事实接近
 研究效度就是“一个研究中的研究結果可以被
复制的程度”
 研究效度高代表研究的结果被复制的程度高，
也就是说研究结果的可信度高
 量的研究：要有高研究效度的研究一定得使用
有高的信效度的测量工具
 质的研究：使用具有高的信效度的测量工具一
定有助於提昇研究的效度，但工具的信效度卻
应该只是研究效度成立的一个重要考量，不必
然是全部
 内在效度指实验的自变量和因变量之间存在明确因
果关系或相关关系的程度。换言之，内在效度就
是研究中的行动对于研究结果有多大影响的程度，
行动对于解决问题所产生的效果越有效，则内在效
度越高。(internal validity)”
 外在效度，指教育研究结果的概括程度，表明实验
结果的可推广的程度。换言之，一项拥有较高内在
效度的研究用在其它类似或相同情况的情境中，若
其效度也高，则表明其外在效度高。(external
validity)”
 内在效度是研究设计的基本要求，是研究质量
的根本保证，是外在效度的先决条件。没有内
在效度便无所谓的外在效度，因为一个研究本
身不科学、不精确，内在效度很低。
 内在效度越充分，结果的可推广度越大，研究
也越有价值。在强调研究内在效度的同时，也
不应该忽视研究的外在效度。
 如果一个研究要有高的外部效度的話，一定先
要有高的內部效度
 有內部效度的研究不一定有外部效度
 有外部效度的研究一定有內部效度
影响研究效度的因素有以下的几个重要項目值
得注意
 取样(sampling)
 研究工具(instrumentation)
 变因控制(variable control)
 多元资料鉴证(triangulation)
 再測信度（test-retest reliability）
 指以同一种测量工具，对同一群受试者，前后测验两次的
相关系数。又称稳定係数。
 复本信度（a1ternate-form reliability）
 同一群受試者接受两种复本测验的得分之相关係数。
 內容效度（content validity）
 反映测量工具本身內容广度的适切程度，強调测量內容的广
度、涵盖性与丰富性
 效标关联效度（criterion-related validity）
 以测验分数和特定效标（criterion）之间的相关係数，表示
測量工具有效性之高低。
 同时效度（concurrent validity）与预测效度（predictive
validity）
 建构效度（construct validity）
 指测量工具能测得一个抽象概念或特质的程度。
19
 信度高的不一定效度高
 效度高的一定信度高
 将同一结论用不同的方法、在不同的情境和时
间里、对样本中不同的人进行检验。
 这种方法的目的是通过尽可能多的资料来源渠
道或资料收集方法对目前已经建立的结论进行
检验，以评估资料和结论的真实性。
根据邓金（Denzin,1978），三角测定有4种基本
类型：
 1）资料三角测定 (data triangulation)，即在

研究中利用不同来源的资料。
 2）研究者三角测定 (investigator
triangulation)，即使用不同的研究人员或评鉴
人员去分析所获得之资料。
 3）理论三角测定 (theory triangulation)，即
使用多种观点取向去诠释一组资料。
 4）方法论三角测定(methodological
triangulation)，即以多种方法研究一个问题或
一个方案。
 为了确保效度和信度，行动研究者应该避免依
赖任何单一的数据来源。大多数研究者采取三
角测量法来提高他们所做研究的效度和信度。
 简单来说，三角测量法是各种资料收集方法的
综合，即综合运用访谈、观察、问卷、文件档
案等方法搜集不同资料来源之后，研究者根据
搜集之多种资料进行归纳、比较与交叉检核，
以确认数据的可信度。


4c 研究的效度和信度2019 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

4c 研究的效度和信度2019 PDF

Uploaded by

Copyright:

Available Formats

信度的定义:

 1）资料三角测定 (data triangulation)，即在

You might also like