博士号取得者インタビュー
2020(令和2)年度 博士号取得支援助成金授与
2024年3月 東京大学博士号(工学)取得
関口 浩さん (取得時69歳)
東京大学大学院工学系研究科 学術コンサルタント
【論文テーマ】
重畳 音声分離における音声特徴量スパース性の寄与に関する研究

パーティーで声を聞き分ける人間の聴力のしくみをAIに活かしてみた
とりあえず就職した企業で面白い研究に出会う
東京大学の学部では応用物理学をやっていた関口浩さん。そのまま修士課程、博士課程に進む道もあったが、それでいいのだろうかと迷ったという。一度産業界に出てほかの分野も見てみようと、当時、勢いのあった東芝に入社した。配属は研究所ではなく事業部だったが、すぐさま「これは面白い」と思うものに出会った。画像や音声を処理する集積回路の開発だった。特に、人間の音声を発生する集積回路のプロジェクトは興味深かった。
これは、デジタル信号処理技術を土台にしており、アメリカのマサチューセッツ工科大学(MIT)に有名な先生がいることがわかった。その技術を深めて習得したいと考え、直属の上長も「それほど言うのなら」と後押ししてくれた。留学先を自分で選ぶ社内留学制度に応募して合格し、入社4年目にMITの修士課程に入学が許可された。会社からは一年半の留学期間を与えられ、標準は二年掛かる修士課程を短縮して取得して帰国した。定年を迎えて始めた今回の博士号研究は、その続きともいえ、当時の研究と、その間に発展してきたAI技術の適用も考えると面白いと考えたのだ。
「知的好奇心と企業で学んだことを世の中のために上手く使って、企業と大学の間を行ったり来たりするというのが大事だと思います。しっかり仕事をする時期と、仕事を休んで深掘りするため勉学研究に戻る時期を、キャリアの中で切り分けてやっていければ一番いいです。自分が育った環境には比較的そういうことをやっている人がいました。そういう人を見て、いい生き方だなと感じてもいました。当時の東芝では年間40人くらいは海外留学していました。そういう人材を育てたという点では、いい会社だったと思います」。
人の聴覚が持つスパース性に着目
人間の5感の中では視覚と聴覚の研究が進んでいる。カクテルパーティで大勢の人が話している中、人間は聞きたい人の声を聞き分けられるが、コンピュータは不得手である。それを実現するためには、音声認識をする前に音声分離という処理が必要だ。人間は音声認識を脳の中でやっているのだから、なにか音声分離を促進する仕組みがあるはず。それがスパース性ではないかと閃いた。スパース(sparse)とは、情報がまばらなこと。人間の聴覚が持つ、冗長度が高い重畳音声からわずかだが重要な情報を抽出して、音声分離に用いる機能だ。
世の中にはAIに音声分離をさせる手法はあるが、スパース性に注目して明示的に組み込んだ技術はない。関口さんの研究はスパース性を明示的に入れ、これまでの技術と比べて良くなるという仮説を実証した研究だ。
そこで、東京大学大学院工学系研究科で社会人博士課程を受け入れていることを知り、森川博之教授にコンタクトし、博士課程の試験を受けて入学した。
実証シミュレーションと実用化について
アイデアの実証のために、スパース性を実現するアルゴリズムを明示的に組み込んだ重畳音声分離プログラムのシミュレーションに取り組んだ。重畳音声分離プログラムに明示的にスパース性アルゴリズムを取り入れた場合と、スパース性を取り入れていない場合に、同一の重畳音声を入れて、分離後の音声品質の差を数値的に示した。結果として、仮説通りスパース性アルゴリズムを取り入れた場合に、分離品質が良いことがわかった。
「スパース性アルゴリズムを幾つも試しましたが、分離後音声の品質が良くならない場合がありました。しかし、あまり悩んだり苦労だと感じたりすることはなく、楽観的に考えていました。種々のスパース性アルゴリズムを考え、他の分野の論文を参考にして、当該手法を導きました。学位を取ることだけを目的とせず、自分が興味あることに取り組んで楽しむことで、肩に力を入れずに向き合えたのだと思います」
次は実用化をどうするかが課題だ。スパース性をすでに世の中にある音声認識アルゴリズムに入れると、さらに良くなる可能性が高いのでぜひ試したい。新しい糸口としてアイデアを出して、シミュレーションで実証しながら世の中で使ってもらいたい。現状は、大きなコンピュータなら可能だが、小さな端末で活用するにはもう1ステップ必要。そのあたりの実用化は企業など組織でやる必要がある。
若い研究者に一つの道を示すことができた
博士課程進学を決めたとき、妻は諦め顔、子供たちは苦笑、学生時代の同期は酒の肴にしてくれた。定年からの博士挑戦なので周りに反対する者はいなかったが、博士号を取得できて気は楽になったという。 学位取得後は、研究室の学術コンサルタントの立場で週1~2日登校し、学生の研究進捗を聞いてアドバイスする。研究環境の整備、コンピュータのセットアップなどの雑用もする。たまに悩みの相談に乗ることも。
「若い人たちにこういう道もあるよと示すことはできました。日本では修士課程の学生がなかなか博士を目指しません。博士号取得の先に何を目指すのか見えにくいのも理由です。社会の側が博士を生かす受け皿をもっとつくっていかなくてはと思います。アメリカでは技術職の30%くらいがドクターを取っていました。大企業やベンチャーのトップも、同様の比率でドクターを持っています。転職が当たり前の社会では、しっかり学問をしながら事業も取り組むというやりかたがキャリア育成に必要なのです。
私自身は仕事と並行して博士課程の研究には取り組めないと感じたので、定年になってから取り組みましたし、MIT留学も研究専念で行きましたが、30代40代でも働きながら博士課程に通う人はいます。両方をキャリアパスに入れることは大切ですし、増えています。こちらの研究室でも8名の博士学生のうち、4名が社会人学生です。自分が行きたい道があるなら、怖がらずにどっぷり入ってみてはいかがでしょう」

