“Tests are my favorite part of school!”と言った生徒は一人もいない。 あるいは教師も。 または管理者。 あるいは親。 あるいは保護者。 あるいは誰であっても、本当に。 そして、その理由を理解するのは難しいことではありません。 学校におけるテストの多くの側面は、教育者にとって特にフラストレーションの溜まるものです。 しかし、評価は教育者にとって最も強力なツールの1つでもあります。
良いニュースは、評価をイライラさせるものの多くは、完全に解決可能だということです。 最近発表された『Tests and Time: An Assessment Guide for Education Leaders』からの洞察をもとに、学校でのテストに対する教師の最大の不満を 7 つ挙げ、それらを解決する方法を説明します。 テストが多い地区では、生徒が1年間に20以上の標準化された評価を受けることもあります。 5260>
全米で、学校での過剰なテストに対する批判が高まっており、多くの州では、家族が自分の子どもたちを一部またはすべての州試験から除外することができるようになっています。 しかし、ほとんどのテストは、実際には、地区、学校、または教室レベルで行われています。 つまり、「オプトアウト」された生徒でさえ、依然として大半の評価を受けているのです。
Suggested Fix (修正案)。
評価は教育において重要な機能を果たすことを覚えておくことが重要です。 そのため、教育者は生徒のニーズに合わせて、指導、サポート、介入をより適切に行うことができます。 学校での過剰なテストは問題ですが、教育者が必要なデータを得ていない場合、生徒へのテストが少なすぎることも現実的な懸念になりえます。 汎用スクリ-ナ、診断評価、成長測定、進捗管理ツール、および標準習得評価が5つの異なるテストである場合、5回別々に生徒をテストする必要があります。 5260>
Lost Instructional Time
評価のための時間を確保すると、指導に使える時間は必ず短くなります。 仮に、幼稚園児から高校生までが 100 回の試験を受け、それぞれが 1 時間であれば、100 時間 (約 15 学校日) が授業に使われないことになります。 多くのテストは 1 時間より長いので (3.5 時間以上のものもあります)、テストのために 40 日またはそれ以上の学校期間を失う生徒がいるのです。 コンピュータ適応型テストや学習科学におけるその他の進歩のおかげで、現在では、学生の学習について有効で信頼できるデータを20分以内に提供する評価が存在します。 そのような評価により、今年、教育者はすでに 770 万時間の教育時間を節約しました (現在も節約中)。
Delayed Results
何日もかけて評価を受けることが十分でないように、教育者とその生徒は、何日か何週間か何カ月も結果を待たねばならないこともあります。 評価の主な目標の 1 つが、指導を導き、情報を提供することであるなら、遅れはすでに長すぎます。
Suggested Fix:
繰り返しますが、教育者は州テストの結果をどれだけ早く得られるかをコントロールできませんが、地区や学校が選択した評価を評価するときに、すぐに結果を得られるオプションを探すことができます。
そして、州テストの結果が遅れることについては、回避策もあります。 ある種の中間評価は、数カ月前の州テストにおける生徒の成績を正確に予測することができます (場合によっては、3 ~ 5 パーセント以内の誤差で)。 学年末テストで生徒がどのような成績を取るか、学年初めの時点でわかっていることを想像してみてください!
Bored and Frustrated Students
テストを受けて喜ぶ生徒はほとんどいませんが、成果の上下限にある学習者にとってこの経験は特に不快になることがあります。 成績の良い学生は、簡単すぎる問題にすぐに飽きてしまい、成績の悪い学生は、難しすぎる問題にストレスや不安を感じたり、怖じ気づいたりすることがあります。 どちらのグループでも、否定的な感情や気晴らしが、学生の真の能力レベルを反映しない、人為的に低いスコアを生み出す可能性さえあるのです。 CAT は、従来の固定形式の評価と比較して、一般的に半分の数の項目で信頼性と妥当性を確保できるだけでなく、低学力および高学力の生徒に対して、学校における従来のテストよりも正確な測定値を提供することができるのです。 これは、CATによる評価が、賢明な試験官を模倣し、生徒の回答に基づいて問題の難易度を自動的に調整するためである。 CAT では、一般に、生徒が回答しなければならない問題は少なく、また、生徒が見る問題は、生徒の特定のスキル レベルに合わせて調整されます。
Lack of Actionable Data
“What’s next?”(次は何をする? 5260>
評価は、「個人のために、または個人についての決定を行う目的で、情報(データ)を収集するプロセス」と定義されることがありますが、これは、テストを実施してデータを集めることは、2 段階の評価プロセスの最初のステップに過ぎないことを意味します。 第2段階は、そのデータを使って教育や学習を強化することです。 特に、評価が明確な行動ステップを提供していない場合、この部分が最も難しくなる可能性があります。
評価が学習進行とリンクしている場合、学生のテスト スコアは進行内の特定のポイントに配置されます。 その結果、教育者は学生がどのスキルを学んだか、そして次に何を学ぶ準備ができているかを知ることができます。 学習進度によっては、特定のスキルに関連した教材が提供されることもあります。 5260>
Misalignment With State Standards
うまくいけば、州試験は州基準に沿っていますが、地区または学校の評価についてはどうでしょうか? その答えに驚くかもしれません。
多くの組織が、自分たちの評価が州の基準に「沿っている」と主張しますが、その後、50 州すべてにまったく同じテストを提供します。 つまり、評価には、あなたの州にとって間違った順序または間違った等級の技能があり、あなたの州が要求する技能はスキップされ、そうでないものが追加されている可能性があるということです。 教師は評価からの情報を完全に信頼することができず、信頼できないテストほど悪いものはありません。
Suggested Fix:
地区または学校の評価がニーズに合わせて本当に調整されているか、理想的にはあなたの州専用に学習進行が構築されているかを確認します。 たとえば、Common Core または Common Core に基づく基準を使用している州であっても、州が Common Core の基準を何らかの形で追加または変更した場合、「Common Core」評価はまだ整合性が取れていない可能性があります。 アセスメントを評価するとき、アライメントと相関性の文書に批判的であること-ベンダーが複数の州で使用されるスキルの一般的なリストしか持っていなくても、それらは作成されることがある。 複数の州で使用されているスキルの一般的なリストしか持っていなくても作成できます。 あなたの州の標準の領域、見出し、言語は、評価そのものとその学習の進行に直接反映されている必要があります。
Disparate Reporting and Inconsistent Data
学年や生徒グループによってテストが異なるため、地区や学校全体でデータに一貫性がないことはありませんか? 異なるソースからデータをつなぎ合わせようとしてどれだけの時間を費やしたかを考えると、ぞっとしませんか。
解決策:
幼稚園前から高校までのすべての学年、およびすべての能力レベルの生徒に対して単一の評価ソリューションを使用すれば、一貫性のない、ばらばらの、または切断されたデータを持つことはありません。 これには、英語学習者、介入中の学生、才能ある学習者が含まれます。 ソリューションによっては、複数のソース (中間評価、州の総まとめテスト、学生の練習プログラムなど) からのデータを集約して、学生の習熟度に関する 1 つの概要を提供することもできます。
テストの長さと頻度から、生徒の学習を長期にわたって追跡する評価の能力まで、「テストと時間:教育指導者のための評価ガイド」は、テストと時間のさまざまな相互作用、そしてそれらが今日の教育者にとって何を意味するかを探求しています。
Tests and Time Book カバー