Page 105 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 通常モードに戻る ┃ INDEX ┃ ≪前へ │ 次へ≫ ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ ▼ケーブルの音の検定法(長文御容赦)その1 小林 03/2/5(水) 23:34 ┗ケーブルの音の検定法(長文御容赦)その2 小林 03/2/5(水) 23:39 ┗レスも長文(全部読む人は二人くらい...) まんぺい 03/2/7(金) 0:20 ┗Re:レスも長文(全部読む人は二人くらい...) 小林 03/2/8(土) 14:43 ─────────────────────────────────────── ■題名 : ケーブルの音の検定法(長文御容赦)その1 ■名前 : 小林 ■日付 : 03/2/5(水) 23:34 -------------------------------------------------------------------------
| 以前議論になった「ケーブルの材質で音が変わるか?」ですが、その検定法について、少し考えてみました。できるだけ簡潔に書くことを心掛けましたが、方法論の解説が含まれる関係上、かなりの長文にならざるを得なかったことをご容赦願います。 議論のあった頃は統計的有意差を論じることができるほどの人数を確保して実験を行うのは現実的には困難だと感じていました。しかし、実験に関心を持つ方も多く参加しておられたし、せっかく盛り上がったテーマが単なる過去のものになってしまうのは残念に思って、その後も時々統計処理について考えていたのですが、最近になって、むしろ多人数による実験は、ケーブルの音の違いというよりは、集団としての人間の耳の良し悪しの統計検定という意味あいの方が強くなってしまって、ここでの目的にはそぐわないということに思い至りました。 それなら、被験者(聴く人)の数は、最少の場合は一人でもよいから、耳に少しは自信のある人(日頃ケーブルの交換で一喜一憂している人)を選び、実験の回数で統計をこなす方がはるかに簡単で、目的に適っているのではないかと考えて組み立てたのがこの素案です。すなわち、オーディオ愛好家レベルの耳を持ったと思われる人を被験者として特定し、その人が統計的に有意にケーブルの音を聞き分けることができるかどうかということを調べるのです。そもそも「有る無し」を論じるのですからそれでよいわけで、あとはプラシーボ効果の排除、要因の特定、再現性の確認などにさえ注意を払えばよい。そして、掲示板を通じて、聞き分けることができる被験者の例数がそこそこ集まれば鬼に金棒です。 また、少なくとも自分自身を被験者として検定しておけば、人との議論の際に「気のせい」「偶然のなせるわざ」などとは言われなくてすみます。 実験方法は簡単で、オーディオ愛好家二人と普通人(?)一人がいればダブルブラインドテストが可能です。休日の午後などを利用すれば、かなりの数のデータが得られると思います。一応デジタルケーブルやCD関係の電源ケーブルを想定していますが、具体的な手順は、やりやすいように改良して行っていただきたいと思います。以下の「その2」に一例を示します(板面節約のため「非-です・ます体文章」ですが、ご容赦を)。 |
| (1)ダブルブラインドテストの方法: 被験者からケーブルやその交換の痕跡が見えないように工夫することがまず大前提となる。その上で、一人(例えばあなた)がケーブルの交換操作(空操作も含む)を終えるたびに、別室に控えている被験者を試聴室の外にいた第三者が呼びに行き、曲をかけるのはその第三者。試聴の間はあなたは試聴室に入らない(両者ともに、実験中顔を合わせるのは第三者だけ)。この第三者もケーブル交換の有無を知っていてはならない関係上、なるべくオーディオに興味のない人(例えばあなたのオーディオ趣味にまったく理解を示さない奥さんや子供達など)の方がやりやすい。 なお、2人しかいない場合にはシングルブラインドテストとなる。この方が随分楽なことは確かであるが、実験の性格上、「当たった」「当たらなかった」が大きな関心事となるので、言葉を交わさない、お互いに顔が見えにくいようにする、雰囲気を悟られないようにするなどの点に注意を払う必要がある。 (2)実験操作: A,Bの2種のケーブルを、あらかじめ決めておいた順、例えばA,A,B,A,B,B,A,A,A,B,Bの順でつなぎ換え、その都度聞き慣れた曲の一節を聴いてもらう。これを1セットとする。このセットの例だと、CDを聴く回数は11回、実験回数すなわち見かけのケーブル交換回数は10回、その中で本当に交換する回数は5回であるが、実際には交換回数と非交換回数とを同じにする必要はない。見かけの交換操作の度に音が変化したか、しなかったかを判定してもらい、結果を記録する。 なお、A,B瞬時切り替え試聴が可能な系ならばつなぎ換えは必要なく、見かけの切り替え(空の切り替えも含む)のみで実験が可能となる。はるかに簡単ではあるが、両者の物理条件が同一になるように配慮する必要がある。また、その場合、ダブルブラインドで行うにはそれなりの工夫が必要。 実験に際しては、本当にケーブルをつなぎ換える回数が1セット中どのくらいか(この例では5回)は被験者には知らせず、また、あらゆる可能性が(例えば一度もつなぎ変えないことなども)あり得ることを認識してもらっておく。ただし、実際に1セット中一度もつなぎ換えない、もしくは全てつなぎ換えるようなデザインを組んだ場合はその1セットの結果だけでは下記の統計検定はできないので、他の、デザインの異なるセットの実験結果を加え合わせてデータを検定する。 なお、この方法の性質上、本来は定量的に扱うべきデータを定性的に(というよりも、all or none、すなわち音質変化有りor 無しとして)扱わざるを得ないので、被験者が変化有りと判定するための閾値をあらかじめ定めておいた方がよい(例えば、明らかに変わったことがわかる点を基準とするなど)。似通ったケーブル同士を比較する場合は、有為な結果を得るためには閾値を低く(例えば何となく変わったような気がする、も認めるなど)設定する必要があるが、データのばらつきも大きくなると予想される。どういう閾値が適切かは実験の目的に依存するので、実際に実験する過程で、やりやすいように細かく定めればよい(例えば、聞き慣れたボーカルの口元が小さくなるなど)。 まずは明らかに違うと予想されるケーブル同士についてはっきりと確認することが重要。その上でさらに、材質は同じだが構造が異なるもの、構造は似ているが材質が異なるもの、材質も構造も似ているがメーカーが異なるものなど種々のケースについて確かめていけばよい。さらには、同種のケーブルでもバーンインの有る無し、クライオ処理の有る無し、接ぎ木ケーブルの接続方向の正逆など、議論の的となっているような対象を比較しても面白い。 (3)結果の整理: AからA、またはBからBの操作、すなわちケーブル交換無しの実験(上の例では5回)での、音質変化無しとの解答の回数をa、変化有りの回数をbとする。同じくAからBまたはBからAの操作、すなわち交換有りの実験(これもこの場合5回)での、音質変化無しの回数をc、変化有りの回数をdとし、次の(2 x 2)定性分割表というものを作製する。 (音質変化無し) (音質変化有り) --------------------------------------------------------- (ケーブル交換無し) a b --------------------------------------------------------- (ケーブル交換有り) c d --------------------------------------------------------- 上の例でいえば、a+bは5、c+dも5となる。 実際の実験回数は多いほどデータの信頼性が確保できる。とはいえ、1セットの実験が長過ぎると疲れるので、つなぎ換え順序のデザインだけを変えた実験を数セット用意し、同一被験者、同一条件下で休憩などをはさんで1セットづつ行い、その結果を加え合わせればよい。 また、被験者を交替するなどして、再現性に関わる例数も増やしたい。 (4)検定: 有意性はカイ二乗検定法で行う。ネットで簡単に行える。 (http://aoki2.si.gunma-u.ac.jp/calculator/chi_sq_test.html) 2行2列でa,b,c,dの値を打ち込めば危険率(上記のHPの表現では有意確率)が算出される。(P = 0.05)以下の危険率で「変化有り」といえるかどうかを判定の基準とする。Pの値が小さいほど危険率が低い。 ただし、厳密な言い方をすると、これは実験での「変化有りとの回答」と「ケーブルの交換」との間に関連性があるかどうかの検定である。すなわち、その被験者が「有意にケーブルの交換を聞き分けられるか」ということである。したがってこの結果には、ケーブル交換による聴感上の音の変化のあるなしと、被験者の耳の良し悪しの両方の要素が含まれている。現時点では「物理的に」知る方法が無いレベルの聴覚上の音の変化を調べるのである以上、それはやむを得ない(そんな方法が有れば、そもそもこの実験の意義が消滅する)。 なお、関連性ありと検定された場合、それがどのくらい強固なものなのかを知ることも重要。それも別の方法で簡単に検定することができる。 (5)要因の特定: 厳密には被験者が聞き分けるのは「ケーブル交換時に介在する多くの要因に起因する音の変化」であり、A,Bのケーブルの違いは要因の一つに過ぎない。したがってケーブルによる音の変化であることを言うためには他の要因の介入を排除する、すなわちケーブルの違い以外は実験条件ができるだけ同じになるよう配慮する必要がある。例えば極端に不適切な例としては「ボリュームが変動した」、「聴取位置がバラバラであった」、「一方のケーブルが接触不良だった」などがあげられる。実際問題としてはケーブルの種類の違い以外で、オーディオファンが日頃認識している種々の音の変わる要因をできるだけ同じ条件下に保つように気を付けることが重要。 (6)再現性: ここで問うべき再現性とは、同じ人が同じ条件で、もう一度実験を行ったら同じ結果が得られるかということよりも、同じケーブル同士の比較についてならば、他の被験者についても同じ傾向をもった結論(やはり両者の音は違って聞こえた)が得られるかどうかということである。複数の被験者による結果や、他の追試者の結果が出てくるのが理想である。ただし、再現性を論じる場合には、(4)でも述べたように、被験者の耳の良し悪しも実験結果に干渉することを念頭に置いておく必要がある(だから、耳に少しは自信のある被験者を選ぶ方がよい)。 (7)予備情報の有無: 被験者が、実験対象ケーブル名を知っている、過去に聴いたことがある、実験直前にそれらをあらかじめ聴いておく、といった予備情報の有無は、この実験の目的と性質から考えて、結果の信頼性を損ねるものではないと考える。しかしながら可能であれば、情報をまったく与えられない被験者を対象とした実験は厳密性という観点からは望ましい。その際には、単なる音の変化の有無の判定以外に、どのように音が変わったかを記録しておくと、先入観無しの音質情報が蓄積される点で意義が大きいと思われる。 (8)問題点: 実験のやり安さを念頭に置いたため、実験方法の根拠や母集団のとらえ方などには以下の問題点がある。それ以外で問題点に気が付かれた方は御指摘をお願いしたい。 すなわち、(2)においては、ケーブルの交換を一連の流れで行っているので、個々の実験は厳密にいえば互いに独立とはいえない。また、(AからA)と(BからB)、および(AからB)と(BからA)をそれぞれ同一の母集団として扱っているが、本来は非交換群は(AからA)のセット、そして交換群は(AからB)のセットのみに限定して、それぞれのセットを独立にランダムに行っていくべきである。 しかし、そうすると同じデータ数を得るためにはCDを聴く回数が2倍になってしまうため、現実性を考えて上のような方法を採用した。私としては「音が変わるか」を調べる上ではそれほど大きな違いはないであろうと考えているが、より厳密には以下の方法の方が望ましい。 すなわち、10回の実験を行うには例えば(A,A)(A,A)(A,B)(A,A)(A,B)(A,B)(A,B)(A,A)(A,A)(A,B)といった流れとなる。毎回先にAを聞いてから、他方を聞いて、その都度比較判定するので、10回の実験のためにはCDを聞く回数は20回となる。そして、厳密にはこれはAからBへと交換した場合の変化のあるなしの検定であって、BからAへの交換についても知りたければ別に行う必要がある。 以上です。ここまで読んでいただいた方は相当辛抱強い人ですね。どうも有り難うございます。それ以外にも「このテーマについては大いに興味はあるが、こんな長い文章、面倒くさくて読む気がせず、とてもやってみるところまではいかないよ」という人が結構いるかも知れません。 しかし、実験自体は、日頃皆さんが取り組んでおられる種々のオーディオの難問に比べれば大して面倒なものではないと思います。操作手順のところだけでも読んでいただきたいと思います。実際にデザインを考えてきた過程で、不完全ながら、少々の実験は既に行って、煩雑なものではないことを確かめています。残念ながら実験環境の悪さ、機会の少なさ、および人的資源の頼りなさにより、未だまともなデータを得るには至っていませんが・・・。 「こんな実験をやって、いったい何の得になるの? そんな暇があったら音楽を聴くよ」という方が大部分だと思いますが、そもそも趣味の世界、色々な興味があってよいと思います。この方法は工夫すればケーブル以外の諸々の要因にも適用できると思うので、オーディオ界に巣くう種々オカルトの検証に役立つかも知れません。 私が示した案は一例に過ぎず、不完全なものだと思います。これをたたき台にして皆さんでもっと適切な、そして行いやすい方法を考え、部分的でも良いですからアイデアや改良点を示していただくと有り難いと思います。 |
| ▼小林さん: どうも御苦労様です。言い出しっぺがサボったままで申し訳ありませんです。 でも、小林さんが私が作るよりも立派な実験デザインを描いてくれました。結果的に私はサボっていて正解だったかも...。(^_^; では、これを叩き台にして、私の意見を述べさせていただきます。 好き勝手に書きますが、私は統計学の専門家ではないことに御注意下さい。 >(1)ダブルブラインドテストの方法: >「被験者」 >「ケーブルの交換操作者」 >「曲をかけるのは第三者」 被験者が一切の操作が判らない(ブラインド)。これはOKです。 それで、験者(操作者)の方も、自分の操作が本当にケーブルを替えたかどうか判らない(ブラインド)ことが必要です。 これが厳密なダブルブラインドです。 曲をかける行為自体は実験に影響ない(バイアスにならない)と思います。 AとBのケーブルが同じものか異なるものか験者にも判らないように(つまり、外見が同じ=プラセボ・ケーブル)する必要があります。 厳密にはです...。(^_^) 実際には、そこまでの精度は全然必要ないと思います。だから、小林さんの方法でも結果は出せます。 > なお、2人しかいない場合にはシングルブラインドテストとなる。 要するに、固定の環境(システム)でA・B2種類のケーブルの音質差を検定するという様な単純な系においては...、 厳密なダブルブラインドが必要ないと、私は考えるものであります。 験者の表情を読みとられない様にさえすれば、このシングルブラインド・テストで十分であります。 >(2)実験操作: A,Bの2種のケーブルを、あらかじめ決めておいた順、例えばA,A,B,A,B,B,A,A,A,B,Bの順でつなぎ換える。 これはブラインドテストとは別の独立した実験手法ですね。主に再現性を確かめる事になると思います。 それこそ、ブラインド抜きでこのテストだけでも宜しいと考えます。 バイアス(思い込み)が増えて、エビデンス(確度)は低くなる危険性がありますが...。 ある程度のスキルの被験者(=験者)が規定の実験環境で施行出来るのならば、本当はこれだけで十分に科学的に意義のあるテストです。 自分のシステム(一定の実験環境)で経験を積んだベテランが、何度も再現性を確認した報告は、確度は低いものの、科学的なデータであると言えます。 きちんとシステム環境を明示して結果(主観的なデータ)を述べた報告を、客観性がないので全く科学的に信用出来ないと批判する人が居たら、その態度は完全に間違っています。 主観的なデータであっても、信頼出来る能力・評価尺度を持った被験者(験者)が上記のように再現性を確認しているのであれば、これは科学的な手法に基づく報告であります。 信頼性(確度)を上げるためには、こういった確かな一例一例の報告を積み重ねることで、間違った報告・バイアス(思い込み)を取り除いていけば良いのです。 > なお、この方法の性質上、本来は定量的に扱うべきデータを定性的に(というよりも、all or none、すなわち音質変化有りor 無しとして)扱わざるを得ないので、被験者が変化有りと判定するための閾値をあらかじめ定めておいた方がよい(例えば、明らかに変わったことがわかる点を基準とするなど)。 ここが最も大事なポイントだと思われます。 被験者のスキル(能力)が大きな問題となります。 優れたソナーマン(潜水艦のソナー担当者)は敵艦の僅かな反響音の違いから船種を聞き分ける能力を持っています。 熟練した機械工は僅かなモーター音の違いを聴き取って、その日の機械の調子、ネジ一本の緩みを発見出来るかもしれません。 しかし、常人離れした聴力を持つと思われる彼らに、聴診器を手渡して心臓病の患者を診せても、心雑音を聴き取ることは難しいでしょう。 心雑音がどういう機序で発生するのか、その病態生理学を熟知し、繰り返し訓練を重ねた医者であれば、ほとんど増幅効果のないビニルチューブ(聴診器)を通した劣悪音質にも関わらず、即座に心雑音を聴き取ることが可能といえます。 ケーブルから何を聴き取るべきか、経験を積んでない被験者には音の違いを認識出来ないと思われます。 次のような状況も考えられます。 私が自宅のいつもの環境で既知のケーブルで上記のテストを行えば、100回繰り返して100回とも正確に違いを聞き分けられるでしょう。この時、10回も繰り返す必要性は無くなります。2−3回の再現性で十分です。 ところが、初めて訪れる部屋で、初めて聴くCDを鳴らした時には、全く違いを聴き取れないかもしれません。 本実験で最も必要なこと...。 それは10回繰り返すことで見かけ上の統計学的信頼性の数値を上げることではありません。 ケーブルの音質差の聴き所を心得た(十分に聴き取り訓練をした)ベテランの被験者を数多く確保することが、信頼性の向上に必要です。 >似通ったケーブル同士を比較する場合は、有為な結果を得るためには閾値を低く(例えば何となく変わったような気がする、も認めるなど)設定する必要がある (中略) >(例えば、聞き慣れたボーカルの口元が小さくなるなど)。 この段落で、小林さんが触れた通りだと思います。 「AとBのケーブルの違いは、このオーディオシステムでこのCDを聴いた時に、このボーカルの口元の大きさにあります」 「ではまず最初に、一週間繰り返し試聴して、この違いを頭に刷り込んで下さい」 「一週間後に、シングルブラインド・テストを施行します」 この様な手続きが必要と感じます。 さらには、もし上記にある様な素人の験者(操作者)が確保出来るのならば、より微妙な音質差を確認することも可能です。 それは被験者の記憶力が期待出来ないときに有効であります。 瞬時に切り替えたAとBの違いは判っても、時間を置いてしまうと判らなくなるケースがあります。 被験者が判定に自信を持てないときには、第三者に頼んで、もう片方のケーブルに戻して貰います。その上で対象となるケーブルがAかBか判定し直して貰います。 この作業を行わないと、上記の再現性繰り返し実験は、ケーブルの違いではなく、記憶力の判定テストになってしまう可能性があります。 >(3)結果の整理: > 実際の実験回数は多いほどデータの信頼性が確保できる。 ケーブルの実験においては、判別出来る人は100回やっても判るし、訓練が完了していない人は何回やっても信頼性が向上しないと思います。 高血圧の治療薬AとBの効果を比較するとき、ある被験者が、たまたまストレスの無い時に服用したかもしれません。たまたま塩分を控えた時に服用したかもしれません。この様なバイアスを避けるために繰り返し投与して、データの信頼性を上げるのが上記の実験方法です。 ところが、ケーブルの様に一定の環境で短時間で試聴を済ますに当たっては、この様に再現性に影響するバイアスは無いと思います。 検討すべきバイアスがあるとすれば、電源環境やシステムの不安定性に起因するものであったり、試聴時の姿勢・位置、体調かもしれませんが、それは高血圧の治療のように、実験中にそんなにコロコロと変わるものではないと思います。 (実は嘘。結構、些細な原因でオーディオの音は毎日変化している...?) > また、被験者を交替するなどして、再現性に関わる例数も増やしたい。 寧ろ、信頼性を上げるにはこちらが必要です。 被験者の数です。といっても十数人で充分だと考えますが。 >(4)検定: 一回のブラインド・テストだけでも事象の確認にはなります。 「宇宙から見た地球は丸かった」 この事実の信頼性を増すには、十人の宇宙飛行士を飛ばして、観察を繰り返すだけ...と言う手法であります。 勿論、測量により科学的に地球が丸いことを証明出来る訳ですが、もしも測量手段が存在しなければ、観察を繰り返す他に出来ることが無いかもしれません。 十人の宇宙飛行士は幻覚を見たのだと批判されるかもしれませんが、他に手段がなければ、こうして観察事実を積み重ねるだけです。 ケーブルの音質への影響が理論的に判らない現在、一例一例のブラインド・テストを積み重ねることです。 下手な例え話しです...。 「太陽しか見ることを知らず、後ろを振り返ることをしない宇宙飛行士には、地球が観察できません」ヘンナタトエ(^_^; >(5)要因の特定: 以上のように、ケーブルによって音が変わることを確認するまでが、本実験の第一の目的と考えます。 要因の特定は、また将来の課題かな...? >(6)再現性: ここで問うべき再現性とは、同じ人が同じ条件で、もう一度実験を行ったら同じ結果が得られるかということよりも、同じケーブル同士の比較についてならば、他の被験者についても同じ傾向をもった結論(やはり両者の音は違って聞こえた)が得られるかどうかということである。複数の被験者による結果や、他の追試者の結果が出てくるのが理想である。ただし、再現性を論じる場合には、(4)でも述べたように、被験者の耳の良し悪しも実験結果に干渉することを念頭に置いておく必要がある(だから、耳に少しは自信のある被験者を選ぶ方がよい)。 ここでも、小林さんは括弧()の中だけで触れている事でありますが、この問題こそが、誰もブラインド・テストを大々的に行わない理由ではないでしょうか? 違いを観察した人には、何度やっても100%確認出来るし、観察できない人(実験環境)に於いては、実験の結果は必ず有意差無しです。 >(7)予備情報の有無: 被験者が、実験対象ケーブル名を知っている、過去に聴いたことがある、実験直前にそれらをあらかじめ聴いておく、といった予備情報の有無は、この実験の目的と性質から考えて、結果の信頼性を損ねるものではないと考える。しかしながら可能であれば、情報をまったく与えられない被験者を対象とした実験は厳密性という観点からは望ましい。その際には、単なる音の変化の有無の判定以外に、どのように音が変わったかを記録しておくと、先入観無しの音質情報が蓄積される点で意義が大きいと思われる。 同意です。普段の掲示板での報告を積み重ねる事に、意義があると思います。 >残念ながら実験環境の悪さ、機会の少なさ、および人的資源の頼りなさにより、未だまともなデータを得るには至っていませんが・・・。 同意。同感です。 以上、ちょっと極端な条件を想定して書き込んでみました。 小林さんにとっては殆ど了解済みの事項だと思います。 が、実験の最終目的が私と違う様な気がします。 追伸:申し訳ありませんが、明日早朝から暫く留守になるのでレス出来ません。 |
| どうも緻密な分析有り難うございました。 何よりもその前に、あのような硬くて読みにくくて、その上やたら長い文章を精読していただいたことに感謝いたします。 一部、補足説明しますので、より良い方法を考えていただきたいと思います。なお、私も統計は素人です。参考書と首っ引きでデザインしました。 (1)ダブルブラインドテスト >被験者が一切の操作が判らない(ブラインド)。これはOKです。 >それで、験者(操作者)の方も、自分の操作が本当にケーブルを替えたかどうか判らな >い(ブラインド)ことが必要です。 >これが厳密なダブルブラインドです。 >曲をかける行為自体は実験に影響ない(バイアスにならない)と思います。 > >AとBのケーブルが同じものか異なるものか験者にも判らないように(つまり、外見が同 >じ=プラセボ・ケーブル)する必要があります。 >厳密にはです...。(^_^) 少し説明が曖昧でしたが、聴く人の位置からはケーブルが見えないように配慮することを前提としています(その人が部屋に入り、そのまま試聴位置に座るまでの間も同様:これはそんなに難しいことではないと思います)。従って、曲をかける人(機器を操作する人)が別に必要となりますが、私のデザインでは、曲をかける第三者を、まんぺいさんの言われる験者(操作者)と見なしています。ケーブルを交換する人は当然ながらヒヤリングには立ち会わない(実験を通じて聴く人とは顔を合わせない)ことになります。 この第三者が曲をかけるときにケーブルの交換の有無が見えない(わからない)ように工夫することが最も難しいポイントですが、その辺は良いアイデアが浮かばず、私の案では無関心な素人を用いるなどとごまかさざるを得ませんでした。 これは、薬の効果を二重盲検するときに、患者と直接接する投与者(医師)にはどちらが偽薬・真薬かを知らせない(医師に薬を渡す人物はそれを知っていてもよい)のと同様に考えました。したがって私のデザインでの曲をかける第三者が医師に相当し、ケーブルを交換する人は医師に薬を渡す人に相当します。 偽薬と真薬の見かけが同じというのは、概念的には、ケーブルの見かけが同じというのに相当するのではなく、交換無しと、交換有りの区別がつかないというのに相当します(すなわち、ケーブルの一方が偽薬、他方が真薬というのではなく、交換無しが偽薬、交換有りが真薬に相当します)。言い換えれば、この実験系では「要因」はケーブルそのものではなく「ケーブルの交換」であり、従って偽交換(交換無し)と真交換(交換あり)が必要となるわけです。だから、聴く人と験者(操作者)が共に交換の有無を知らないように配慮すればそれでよいのではないかと考えました。 >厳密なダブルブラインドが必要ないと、私は考えるものであります。 >験者の表情を読みとられない様にさえすれば、このシングルブラインド・テストで十分 >であります。 家族を巻き込んで、実際に両方とも少しはやってみたのですが、私もまったく同感です。 (2)統計検定 >小林さんにとっては殆ど了解済みの事項だと思います。 >が、実験の最終目的が私と違う様な気がします。 たぶん統計の考え方の事を言っておられるのだと思います・・・。 >本実験で最も必要なこと...。 >それは10回繰り返すことで見かけ上の統計学的信頼性の数値を上げることではありま >せん。 ケーブルの議論スレッドを読んでいて最も気になったことは、「気のせい」という指摘(これはブラインドテストで排除できる)ですが、もう一つが「私が体験したのだから本当だ」という論法に対する反発です。これは確かに「私がUFOを見たのだから本当だ」と同じで科学的ではないことは確かですが、物理的に判別できないレベルの音を扱う以上、物理の言葉で反論することは不可能です。 とすると、最も有力な方法は、自分自身の体験を統計検定することです。生物が関わる生体反応を対象とした実験では、単発的な結果と正しく統計検定された結果とでは、月とスッポンぐらい、重みに違いがあります。というか、原則的には統計的に有意でないと説得力無しと見なされます。 統計検定によって、個人による結果を科学の言葉(例えば、「Mさんを被験者とした場合、ケーブルの交換と音質変化有りとの間には5%以下の危険率で因果関係が考えられる」など)で論じることが可能になります。さらに、そのような例数が3人分以上集まれば、統計結果どうしをさらに統計検定することが可能で、十分に科学的と言ってよいレベルの話しとなります。要は、「たまたま起こったことだ」と言われる可能性を排除するということです。 したがって私のデザインした繰り返し実験は、程度問題としての信頼性をあげるために実験回数を積み重ねることを目的としているのではなく、統計検定が大前提となるので、それが可能な実験回数は確保せざるを得ないという必要悪的見地からきています(5%以下の危険率というのが、一般に通用する有意の基準だそうです)。 ですから、私と違って環境も耳も仲間にも恵まれた、まんぺいさんのような方に是非とも検定された結果を出していただきたいと思っています。特に100%近く当てることができるとなると、危険率はきわめて低い値になりますから、3人分以上の結果が集まれば、誰も口を差し挟めないデータとなり、それでケーブル論争の一般的な部分(個別には色々あるでしょうが)は決着となります。 よろしくお願いします。 上にも出てきた「実験の最終目的」ですが、私の場合、簡単に言うと「ある程度の耳を持った人は、ケーブルの音の違いを聞き分けることができる。違いがわからないのは恐らく耳の感受性の問題であろう」という命題の検証ということになります(あたりまえかな)。 |