機械学習③ 研究紹介

機械学習

機械学習の主な機能は、グループ分けです。人間が処理できないほどの膨大なデータを、データに含まれる特徴により、分類作業をしてくれます。

ただ、そのためにはデータがないとダメです。
Google社やFacebook社などは、多量のデータを持っているので、機械学習の能力をフル活用できています。また、自動運転に適用する場合も、走行データが必要です。データがないと、いかに機械学習のアルゴリズムが素晴らしくても宝の持ち腐れになります。

では、僕が何のデータを使って分類しているか、ですが、今は、赤外吸収スペクトルのデータを使っています。

Decision tree–based identification of Staphylococcus aureus via infrared spectral analysis of ambient gas - Analytical and Bioanalytical Chemistry
In this study, eight types of bacteria were cultivated, including Staphylococcus aureus. The infrared absorption spectra...

分子はその構造により、特定の赤外線を吸収します。
つまり、赤外線の吸収の様子が分かれば、そこに存在している分子が分かることになります。
赤外線の吸収の様子を示すデータが、赤外吸収スペクトルです。

理論的には、たしかに、赤外吸収スペクトルから、そこに存在している分子が分かるのですが…
実際には、膨大な種類の分子が存在しているので、スペクトルと分子を対応させることは困難です。

そこで、役に立つのが機械学習です。

分子の種類を特定しなくても、機械の力で赤外吸収スペクトルは分類できます。
その結果、「どういうスペクトルだと、人間にとって有害か?」を明らかにできます。

この研究は「空気に赤外線を当てるだけで、空気のきれいさ(周囲の菌の有無)を知ることができる」ことを示したものです。

科学は「不思議さ」を「解釈する」行為です。
そして、工業は科学を発展させて「人を幸せにする」行為です。

その両方の行為の目的を踏まえて、
赤外吸収スペクトルには、どんな情報が、どのような形で表れているのだろうという「興味」から始まって、その興味を少しでも「解釈ができ」、そして、その結果が、少しでも「人類の健康に貢献できる」ようになることを目指し、頑張っています。

コメント