研究には色々なパターンがあります。

仮説生成型の研究

仮説生成型(hypothesis making)あるいはデータ駆動型(data driven)の研究は、データを広く得てから、そこから現象(事実)に対して論理的な枠組みを与えたり、漠然として掴みどころのない問題をもう少し具体的な問題へと落としこむための研究手法です。具体的には、スクリーニングや網羅解析、アンケート調査などが挙げられます。

これらの特徴は、研究が始まる前にはその結果について全く予想ができないという点です。まさに「やってみなきゃ、わからない」というタイプの研究です。得られた結果を解析し、そこに現象を理解するためのヒントが隠されていないかを探ります。無事にヒントが見つかれば、仮説検証型の研究へとステージを移します。

仮説生成型のみだと申請書には不向き

研究を持続させたり、予想外(予想以上)の結果を得るためには、こうした仮説生成型の研究は避けて通れません。しかし、申請書となると相性は良くありません。仮説検証型だとストーリーが明確であり、やるべきこともある程度はっきりしています。すでにある仮説を予備データとして示すことで、研究が進んでいることをアピールすることも可能です。

一方で仮説生成型では、審査員だけでなく申請者本人ですら先を見通せないため、申請書で説得力のある研究計画やその根拠を提示することができないからです。言い換えると、仮説生成研究は「仕込み」の研究であり、研究成果の「収穫」を求める審査員の期待に答えにくい研究タイプです。

ただし、他の人のこれまでの成果を利用することで、このステップを短くすることは可能です。既に論文として発表されている結果を組み合わせたり、再解釈することによって仮説を作ることができますし、公開されているデータベースの再解析からも仮説を作ることもできます。申請書においては、こうした情報を引用しつつ、研究の背景・問題点で仮説を生成しておくと、後の研究計画につながりやすくなります。

既に発表されている論文からの仮説生成する場合

科学とは過去の研究成果の積み上げを利用して前に進むものですから、過去の論文の結果をもとに仮説を作ることは自然なことです。その際には、いくつかポイントがあります。

1.複数の論文を組み合わせるか、解釈の切り口を変えること

ある一つの論文だけから仮説を作ったり、著者らが示した研究の方向性をそのまま採用したりしてはいけません。こうしたわかりやすいものは、その論文の著者らが既に手を付けているか、あるいは、他の読者が手を付けています。いずれにせよ、非常に競争が厳しい上に、予想されている研究の展開ですので、あまり面白みがありません。

お勧めの1つめは、複数の論文の結果を組み合わせることです。論文の組み合わせ方は無数にあるため、同じアイデアで考える人の数は劇的に減ります。また、組み合わせることで新しいアイデアになり、研究のオリジナリティが生まれます。

お勧めの2つめは、解釈の切り口をかえることです。「著者らはこのデータからこういう結論にしていたが、実はこうとも考えられるのではないか」というような発想でデータを眺めていると新たな解釈が生まれてきます。そのアイデアの源泉は、おそらく、あなたの持っているバックグラウンドによるものなので、他の人にはない独自の着想ということになります。

2.これまでの自分の研究との首尾一貫していること

どんなに魅力的な仮説を思いついたとしても、これまでやってきたこと(研究室でやっていること)とあまりにも違いすぎる研究は相応しくありません。これまで、「月」の研究をしていた人が、明日から「すっぽん」の研究をするようなものです。

審査員はあなたをその分野のプロとみなして研究費を渡すのですから、これまでの蓄積を全て放棄した、「素人」に対しては厳しい評価になってしまいます。解析手法、考え方、目指すゴールなど何かしら一本の芯のようなものを見せる必要があります。逆に言えば、この芯さえはっきりしていれば、研究対象を変えることは自然であり、デメリットではありません。

公開されているデータベースからの仮説生成する場合

近頃は大規模なデータを取ることが容易になり、日々、大量のデータが生み出されています。一方で人間の能力や時間には限りがありますので、生み出されたデータの多くは「味わい尽くされて」いません。そこにチャンスが転がっています。

あなた独自の視点からデータベースを眺め直してみましょう。きっと新しい発見があります。高校生がガンの早期診断方法を開発した話は有名な例でしょう。インターネットの登場はビジネスに大きな変革をもたらしましたが、研究においても同じく大きな変革をもたらしています。誰にでも利用できるデータベースを利用して研究を行うことは可能です。

仮説検証型の研究

仮説検証型(hypothesis proving)あるいは仮説駆動型(hypothesis driven)の研究は、現象(事実)を説明するために作られた仮説を検証し、その有効性を確認するための研究手法です。○○○アッセイや△△△法など、ほとんどの研究はこちらに属することになると思います。

これらの特徴は研究が始まる前には既に、その結果をある程度は予想できるという点です。予想通りになればそれで良いし、予想外の結果が出れば「なぜ予想と異なる結果になったか」について考えることで新たな仮説生成へとステージを移します。

仮説検証型の研究は、申請書との相性が良く大変重宝します。仮説があることで、申請書の実現可能性に一定の根拠が与えられます。また、研究の流れが明確になり、今後の研究計画もわかりやすいものとなります。もちろん、予想通りの結果が得られなければ「絵に描いた餅」なのですが、審査員はまさにこの「絵」を求めているのです。

仮説の検証そのものを研究目的としてはならない

仮説検証型の研究において最もよくある間違いのひとつは「申請者は、〇〇〇は〇〇〇ではないかと考えた。そこで本研究ではこの仮説を検証することを目的とする。」と書くことです。

そもそも仮説とは「何かを明らかにするために仮に立てた説」であり、その何かを明らかにすることこそが真の目的であるはずであり、仮説の検証はそのための手段です。これはいわゆる「手段の目的化」であり、他の可能性を排除している点で非常に視野の狭い研究です。この場合、検証する仮説がハズレだった場合には何も残らず悲惨です。

どちらが良いのか

ときどき、仮説検証(駆動)型は事前のバイアスがきつすぎて捏造などを生み出す温床となるという批判があります。確かに事前に「こうあるべきだ」「こうあって欲しい」という思いが強いと事実を見落としたり、誤認したりします。

たとえば、以下の動画を見て、白チームのパスの回数を数えてみてください。

多くの人はパスの数を数えることに集中するあまり、ムーンウォークする人の存在を見落としていたと思います。このように、バイアスとなり得るような事前の仮説を設ける仮説駆動型は危険な研究手法と見られているように感じます。

実際、ある現象が起きるというデータを取りたい人が延々と実験を続け、たまたまそういうデータが出ると「やっと、うまくいった」と思い、実験を中止するようなことが問題となっています。しかし、こうした問題はデータ駆動型でもあり得ます。解析する以上、ある目的を持っているのは明らかです。意味なく解析する人はおらず、必ず「こうだったらいいな」という思いがあるはずであり、結局これがバイアスとして働きます。

つまり、バイアスによるデータ取得や解釈のゆがみは仮説駆動型かデータ駆動型かといった問題ではなく、別の問題です。

結局は研究ステージの違いにすぎない

まだ研究上の仮説が存在しない段階では何が研究テーマになり得るのか判らないため、あらゆることを試す必要があります。例えば、オミクス解析や対象をじっくり観察するなどの研究手法はこうした場合によく行われます(もちろん、仮説を証明するための実験である場合もあります)。一方で、研究上の仮説が定まったら、それを証明するステージに移行します。明確な仮説がある以上、事前の仮説なしに実験することはピント外れの実験を多く含むことになり効率が落ちます。

つまり、実験ステージは仮説生成→仮説証明→結論と進むのであって、単なるステージの違いにおける研究タイプの違いというだけの問題です。

データの取得や解釈のゆがみの問題はどう扱うべきか

さきほど別問題としたデータ取得や解釈のゆがみが生じるという問題に対してはどう考えるべきでしょうか?

これは、生成した仮説に対する思い入れが強すぎることが原因です。「この仮説で間違いない」という思いが強ければ強いほど、不都合なデータには目をつぶりたくななるものです。ですので、仮説はあくまでも仮説であり、「事実に勝る面白いものは無し」という意識を普段からしっかり持っておくことが重要です。もし指導者の立場であるならば、「これはあくまでも仮説であり、予想と違ったデータがでたら、仮説を修正してより面白いものにしよう」というメッセージを実験者に強く伝えておく必要があります。