よくある質問

SI(官能評価)

ライバル商品と比較した評価結果で購買意向がとても高かった商品が、実際には全く売れませんでした。どうしてでしょうか？

この様な問題は，官能評価でいうところの「分析形評価」「嗜好形評価」の違いがあいまいになっているところから生じているケースが多いようです。

「分析形評価」＝分析能力のある専門家が製品を評価基準に従って評価する。
　　　　　　　・繰り返して評価を行っても同じ結果が得られる。
　　　　　　　・評価基準に対する嗜好性によるブレが極めて少ない。
　　　　　　　・集団としても同じ結果を返してくれる。

「嗜好形評価」＝分析能力と知識を持たない評価者が，ある基準で製品を評価する。
　　　　　　　・繰り返して評価を行った場合、都度結果が違う可能性がある。
　　　　　　　・評価基準に対する嗜好性によるブレがある。
　　　　　　　・集団としての結果は、評価結果の多数決で決まる。

つまり、上記のようなケースは、能力のある評価者を対象とした「分析形評価」を、分析能力と知識を持たない評価者に対して行った可能性があります。「社内での評価結果と市場調査の結果が一致しない」ような場合にも同様のことが考えられます。
官能評価とマーケティングの違いは、この評価者の能力想定にあります。官能評価なら、まず評価者の能力をチェックのうえ分析的評価を設計します。［1］［2］

参考文献
［1］井上裕光：官能評価セミナー配付資料
［2］井上裕光：「官能評価の理論と方法」，日科技連出版社，2012

自社製品（食品）の現行品Ａと改良品Ｂについて社内パネルで比較評価を行いました。その際、現行品Ａを先に試食して０点と定めて、その後で改良品Ｂについて7段階（0±3点）で評価しました。この結果の統計解析方法を教えてください。

この評価結果は解析してもあてになりません。データを取る方法に問題があります。

その問題とは、

１．「現行品である」「改良品である」という情報がバイアスになり、評価に影響を与えてしまうこと（とくに社内では自社品を知っていることが多いため可能性があること）。
２．評価の際に先と後のサンプルが固定されているので、順序効果が評価に影響を与えてしまうこと。

なのです。

対策は、

１．評価者が十分訓練されたパネルであれば、それぞれのサンプルに3桁の乱数からなる数字をラベルしてブラインドで評価し、先と後の評価順序が半々になるようにパネルを割り付け、2品それぞれを多段階尺度や線尺度で絶対評価し、得られた結果を通常の分散分析で解析します。

２．絶対評価ができるほどの能力がない評価者の場合は一対比較が有効です。上記と同じように、ブラインドで評価順序を先と後の評価順序を半々にした上で、後に評価したものを中央の0点とし、先に評価したものに点数を多段階（0±3点等）でつけます。統計解析には一対比較用の分散分析が用意されていますので、それを用います。

官能評価に際しては、目的、評価者の能力、評価者の人数、サンプルの差の性質、サンプルの差の大きさなどに応じて適切な方法を選ぶ必要があります。とくに、目的と評価者の能力を十分考慮して実施しましょう。

品質管理において、原料変更、工程変更などで生じる品位差を確認するための試験として、識別試験法を考えています。識別のための2点試験法、1対2点試験法、識別のための3点試験法の中で選ぶとすると、どの手法がよいでしょうか？

評価者が品位差を識別できる能力を持ち、訓練されたパネルであることを前提条件として、3種類の方法のメリットとデメリットを見てみましょう。

識別のための2点試験法：評価対象が1対なので疲労が少なく、2品の差を精度よく見極めることができます。

しかし、事前にどんな属性に違いがあるのか、あるいは、その属性の強弱がどうなっているのか、が判明していない場合には、評価者の能力が必要になり、統計的に有意差を見つけるのが困難になります。また、サンプル提示順の効果を打ち消すために、評価順を考慮した一定回数以上の繰り返しも必要になります。（あるいは、一定以上の評価者数が必要になります）

１対2点試験法：評価対象の数が増えるため、識別のための2点試験法よりは疲労を伴いますが、感じられる違いの有無について、評価者の能力についてはそれほど必要とせず、統計的有意差を見つけることができます。

しかし”有意差あり”を示すためには2点試験法と同様に多くの評価の繰り返し数（あるいは、評価者数）が必要になります。

識別のための3点試験法：感じられる違いの有無について1対2点試験法よりも少ない評価の繰り返し数（評価者数）で”有意差あり”を示すことができます。

しかし、実験時の評価対象が3つに増えるため、上記の2方法より疲労が大きくなりがちです。さらに、香りなどのように前のサンプルの影響が残ってしまう評価では注意が必要で、3点の組み合わせ提示順も考慮する必要が出てきます。

これらの識別試験を実施する際は、同時にフリーコメントで「どんな差があったか？」を聞くことで判断材料を増やすことができます。

官能評価に際しては、目的、評価者の能力、評価者の人数、サンプルの差の性質、サンプルの差の大きさなどに応じて適切な方法を選んで実施しましょう。

食品の場合，その形態および状態を完全に均一にすることは不可能ですが，官能評価に用いるサンプルの場合，どこまで揃えればいいのでしょうか。

サンプル間変動の問題ですが，一般的な「実験」では考えられないほど変動するのが実情です。官能評価では，この変動を管理することを考えて，「実験目的で分ける」という対応策をとることが多いようです。

１．開発段階か最終製品段階か。開発段階（見込みのありそうなサンプルを残す）ならば，中庸なサンプルを選ぶ。

２．外観検査の場合等は限度見本を設定して「評価の範囲」を見せる。

３．最終製品段階では，（合否の）限度見本や標準見本を事前に評価して，見本に対しての評価実験とする。

つまり，「何が標準か」ということを事前に検討したうえで実験を構成するということです。条件統制もこの範囲で行うということになります。

お困りではありませんか

Q1: TQMの主な効果は何ですか？
Q2: TQMの取り組みを進めていますが、標準的な取り組み、あるいは他社の取り組みと比べて自社がどういうレベルにあるのかを知りたいのですが。

▲TOP