はかる・くらべる・ほりさげる
作品や研究の価値を客観的に示すためには,「なんとなく良い」ではなく,体験者がどのように感じたかを数値やデータで示す必要があります.このセクションでは,何を測るか(はかるもの),どうやって測るか(はかる方法),どう比較・深掘りするか(くらべる・ほりさげる) の3つの観点から評価手法を紹介します.
はかるもの
まず,「そもそも何を測定するのか?」を整理しましょう.
1. UX(User Experience:ユーザ体験)
UXとは,製品やサービス,アート作品などを使ったり体験したりしたときに,ユーザが感じること全体を指します.「使いやすかった」「面白かった」「また体験したい」など,すべてがUXの一部です.
インタラクティブな製品のUX評価は主に以下の2つの品質に分けられます:
- 実用的品質(pragmatic quality) --- 「使いやすいか」「わかりやすいか」「効率的か」など,目的を達成するための品質.スマホアプリなら「目的の機能にすぐたどり着けるか」
- 感性的品質(hedonic quality) --- 「面白いか」「新鮮か」「魅力的か」など,感情的・感性的な満足に関わる品質.スマホアプリなら「使っていてワクワクするか」
なぜ2つに分けるのか?
「使いやすいけどつまらない」製品もあれば,「使いにくいけど面白い」製品もあります.両方の品質を別々に評価することで,作品のどこが強みでどこが改善点かを明確にできます.
2. 印象
対象から受ける印象を評価する際は,複数の形容詞やオノマトペを通じて評価します.例えば,ある作品の印象を「明るい ←→ 暗い」「柔らかい ←→ 硬い」のような対になる言葉の尺度で数値化します.一つの形容詞だけでは捉えきれない多面的な印象を,複数の形容詞対を組み合わせることで客観的に把握できます.
3. 好み
直感的に良い,しっくりくる,ふさわしいと感じること.印象とは異なり,好みは「自分にとっての価値判断」を含みます.同じ作品でも,人によって好みは大きく異なります.
4. 感情
感情の測定には P(V)ADモデル がよく知られています:
| 次元 | 意味 | 例 |
|---|---|---|
| Pleasure / Valence(快不快) | ポジティブ ←→ ネガティブ | 嬉しい ←→ 悲しい |
| Arousal(覚醒度) | 興奮 ←→ 鎮静 | ドキドキ ←→ リラックス |
| Dominance(支配度) | 支配的 ←→ 従属的 | 自分がコントロールしている ←→ 圧倒されている |
コンテンツから受け取る感情は,特に 快不快 と 覚醒度 の2軸で評価することが多いです.例えば,ホラー映画は「不快×高覚醒」,ヒーリング音楽は「快×低覚醒」のように位置づけられます.
はかる方法
1. SD(Semantic Differential)法
作品や製品等から受ける人の印象を 客観的に数値化して分析する手法 です.
やり方: 「明るい - 暗い」「人工的な - 自然な」など,対立する形容詞のペア(形容詞対)を複数用意し,それぞれについて5段階または7段階で「どちらに近いか」を回答してもらいます(参考文献).
結果の見方: 各形容詞対の平均値を折れ線グラフでつなぐと,対象の「印象プロフィール」が浮かび上がります.複数の作品や条件を同じグラフ上に重ねることで,印象の違いが一目でわかります.
具体例
「ある音響作品」と「従来のスピーカー再生」の印象を比較する場合:
- 作品A:「幻想的」寄り,「動的」寄り,「心地よい」寄り
- 作品B:「現実的」寄り,「静的」寄り,「不安」寄り
→ 作品Aは没入感のある非日常体験を提供できている,といった分析ができる
参考: ARインスタレーションの印象評価,バーチャル森林浴コンテンツの印象評価,SD法による調査結果のグラフ化
2. 半構造化インタビュー
あらかじめ質問項目を用意しておきつつ,回答内容に応じて臨機応変に質問を追加・変更しながら掘り下げていく調査手法です(参考サイト).
アンケートとの違い: アンケートは「はい/いいえ」「5段階評価」のように回答が限定されるため,想定外の発見が得にくい.インタビューでは「なぜそう感じたのか?」「具体的にはどの瞬間?」と深掘りできるため,数値だけでは見えない体験の質を把握できます.
「半構造化」の意味: 完全に自由な会話(非構造化)だと話がそれやすく,質問項目を厳密に固定(構造化)すると深掘りができない.その中間をとったのが半構造化インタビュー.
3. フォーカスグループインタビュー(FGI)
1人の司会者(モデレーター)が4~8人程度のグループに対して座談会形式でインタビューを行う調査手法です(参考サイト).
メリット: 参加者同士がお互いの発言に刺激されるため,1対1のインタビューよりも多様な意見が出やすい.「あ,私もそう思った!」「それとは逆で...」のように議論が活性化する.
注意点: 声の大きい参加者に引っ張られて,全員が同じ意見に収束してしまうリスクもある.
4. 具体的な測定方法(尺度・質問紙)
研究の世界では,すでに信頼性・妥当性が確認された測定ツール(尺度)が多数存在します.目的に応じて適切なものを選びましょう.
| 尺度 | 何を測るか | 特徴 |
|---|---|---|
| AttrakDiff | 製品の実用的品質・感性的品質 | UXの古典的な尺度.実用性と魅力の両面を評価 |
| UEQ / UEQ-S(アンケートサンプル) | UX全般 | 8項目の短縮版(UEQ-S)は手軽に実施可能 |
| SAM(アンケートサンプル) | 感情(快不快・覚醒度) | 言葉ではなくイラスト(マニキン)で直感的に回答する.言語に依存しないのが利点 |
| POMS2 | ネガティブな気分 | 緊張,抑うつ,怒り,疲労,混乱などのネガティブ気分を多面的に測定 |
| Temporal Dominance of Emotion | 感情の経時変化 | 体験中の感情がどのように移り変わったかを時系列で捉える |
| PRS | 場所の回復感(癒し力) | 空間がどれくらい心理的な休息をもたらすかを4因子で評価 |
| PANAS | ポジティブ感情・ネガティブ感情 | 快と不快を独立した2つの軸として評価する尺度 |
| ME(マグニチュード推定)法 | 感覚の強さ | 基準となる刺激に対して「何倍に感じるか」を数値で回答させる.感覚の強度を直接数値化できる |
くらべる・ほりさげる方法
評価結果をより深く理解するために,以下のような比較・分析手法を用います.
比較の方法
- 作品内の要素を変える --- 例えば音あり版と音なし版を用意して,音の効果を検証する(比較のためのダミー作品を用意)
- 媒体を変える --- モニター ⇔ プロジェクタ,ヘッドホン ⇔ スピーカなど,提示方法の違いが印象に与える影響を調べる
- 既存作品と比較する --- 自分の作品と似た既存作品・製品を並べて評価することで,自分の作品の特徴を浮き彫りにする
統計的な分析手法
- 分散分析(ANOVA) --- 3つ以上のグループの平均値に統計的に意味のある差があるかを検定する手法.例えば,作品A・B・Cの印象評価に差があるかを検定できる.2グループの比較ならt検定を使う
- 因子分析 --- SD法で得られた多数の形容詞対の評価結果を整理し,背後にある少数の因子(カテゴリ)を見出す手法.例えば,「明るい」「鮮やか」「派手な」がひとまとまりになれば,それを「活動性」因子と名付けられる
データの探索手法
- コンジョイント分析 --- 商品やサービスを構成する複数の要素(色,素材,形など)のうち,どの要素がどれくらい好みに影響しているかを明らかにする手法.「色が最も好みに影響している」といった知見が得られる
- テキストマイニング --- アンケートの自由記述やインタビューの文字起こしから,頻出する語句や,一緒に使われやすい語句の組み合わせ(共起)を統計的に分析する手法.大量のテキストデータから傾向を読み取るのに有効