Download as pdf or txt
Download as pdf or txt
You are on page 1of 23

信度的定义:

 穩定度(stability)
 一致性(consistency)

 即对同一件事物进行兩次或以上的测量,其
結果的相似程度。即不同的测验时点下,测
验分数前後一致的程度
信度所指的是可靠性或信任度,指研究的前后一
致性以及研究能在多大程度上重复。测试的信度
越高,学生在测试中所获得的分数将于下一次考
试分数差距不远。

例:可以期待第一次受试的高分者,在下一次的
实测中也会得高分;或许分数不一定相同,但一
定很接近。
 效度指的是测量到的结果反应所想要考察的
内容的程度。

 测量结果和要考察的内容越吻合,效度则
越高,反之效度越低。

 效度表示一切研究的真实性和准确性程度,
它与研究的目标密切相关。

 一项研究所的的结果必须符合其目标才算
有效的,因而效度也就是达到目标的程度
 为了达成研究目标,必须藉由研究工具来获取
所需资料,为此在准备或选用研究工具时,效
度是一个重要的考量因素。
 在定性资料中,可以通过获取资料的忠实性、
深刻性、丰富性和范围,涉及的参与者,三角
互证的程度,以及研究者的公正性或客观性来
分析效度。
 在定量资料中,可以通过细致的抽样、编制适
当的工具,以及对资料进行适当的统计处理,
来提高效度。
例如:
 想要了解教师对校本评估之看法,研究者所需
的包括收集资料的研究工具,以及如何能确保
所获得的资料确实能说明教师真正想法的结论

 如果想要了解学生对非洲文化的理解,以非洲
自然地理为测验范围所得分数就不适合用来作
为推理基础。
 一个“真实”的成绩是80分的学生在测验中只
获得60分(说明测验没有效度),但他每次参
加这个测验都得到60分(说明测验有信度)。

 -一个有效度的测验总是会有信度,但是一个有
信度的测验则不一定有效度。

 一个测验测量到它想要测量的东西,那么它就
有效度,但是一个只有信度的测验却一直只测
量到错误的事情,那它就没有效度了。
 在研究的过程中,我们常常会碰到的效度問題
有二个:

 工具效度
 研究效度
 工具效度=工具+效度
 一个测量工具测到它宣称可以测到被研究对象
的某一特质的程度

例如:
 要看一个“国小五年級自然科学习成就问卷”
的工具效度就是要检视其是否能忠实反映被研
究对象的自然科学习成就

 工具效度高代表其测量结果和事实接近
 研究效度就是“一个研究中的研究結果可以被
复制的程度”

 研究效度高代表研究的结果被复制的程度高,
也就是说研究结果的可信度高
 量的研究:要有高研究效度的研究一定得使用
有高的信效度的测量工具

 质的研究:使用具有高的信效度的测量工具一
定有助於提昇研究的效度,但工具的信效度卻
应该只是研究效度成立的一个重要考量,不必
然是全部
 内在效度指实验的自变量和因变量之间存在明确因
果关系或相关关系的程度。 换言之,内在效度就
是研究中的行动对于研究结果有多大影响的程度,
行动对于解决问题所产生的效果越有效,则内在效
度越高。(internal validity)”

 外在效度,指教育研究结果的概括程度,表明实验
结果的可推广的程度。换言之,一项拥有较高内在
效度的研究用在其它类似或相同情况的情境中,若
其效度也高,则表明其外在效度高。(external
validity)”
 内在效度是研究设计的基本要求,是研究质量
的根本保证,是外在效度的先决条件。 没有内
在效度便无所谓的外在效度,因为一个研究本
身不科学、不精确,内在效度很低。

 内在效度越充分,结果的可推广度越大,研究
也越有价值。 在强调研究内在效度的同时,也
不应该忽视研究的外在效度。
 如果一个研究要有高的外部效度的話,一定先
要有高的內部效度

 有內部效度的研究不一定有外部效度
 有外部效度的研究一定有內部效度
影响研究效度的因素有以下的几个重要項目值
得注意
 取样(sampling)
 研究工具(instrumentation)
 变因控制(variable control)
 多元资料鉴证(triangulation)
 再測信度(test-retest reliability)
 指以同一种测量工具,对同一群受试者,前后测验两次的
相关系数。又称稳定係数。

 复本信度(a1ternate-form reliability)
 同一群受試者接受两种复本测验的得分之相关係数。
 內容效度(content validity)
 反映测量工具本身內容广度的适切程度,強调测量內容的广
度、涵盖性与丰富性

 效标关联效度(criterion-related validity)
 以测验分数和特定效标(criterion)之间的相关係数,表示
測量工具有效性之高低。
 同时效度(concurrent validity)与预测效度(predictive
validity)

 建构效度(construct validity)
 指测量工具能测得一个抽象概念或特质的程度。

19
 信度高的不一定效度高
 效度高的一定信度高
 将同一结论用不同的方法、在不同的情境和时
间里、对样本中不同的人进行检验。

 这种方法的目的是通过尽可能多的资料来源渠
道或资料收集方法对目前已经建立的结论进行
检验,以评估资料和结论的真实性。
根据邓金(Denzin,1978),三角测定有4种基本
类型:

 1)资料三角测定 (data triangulation),即在


研究中利用不同来源的资料。
 2)研究者三角测定 (investigator
triangulation),即使用不同的研究人员或评鉴
人员去分析所获得之资料。
 3)理论三角测定 (theory triangulation),即
使用多种观点取向去诠释一组资料。
 4)方法论三角测定(methodological
triangulation),即以多种方法研究一个问题或
一个方案。
 为了确保效度和信度,行动研究者应该避免依
赖任何单一的数据来源。大多数研究者采取三
角测量法来提高他们所做研究的效度和信度。

 简单来说,三角测量法是各种资料收集方法的
综合,即综合运用访谈、观察、问卷、文件档
案等方法搜集不同资料来源之后,研究者根据
搜集之多种资料进行归纳、比较与交叉检核,
以确认数据的可信度。

You might also like