タンパク質デザイン・タンパク質創薬・生物物理学
東京大学 新井研究室では、医療や産業に役立つタンパク質の新規デザインを目指した実験と理論的研究を行っています。特に、最先端のタンパク質設計法を駆使して、ウイルス感染、がん、アレルギーなどの疾患をターゲットにした創薬を目指しています。また、バイオ燃料などの有用物質を効率的に生産できる酵素の開発にも取り組んでいます。さらに、タンパク質のフォールディング機構などの基礎研究も行い、革新的なタンパク質デザイン法を開発します。これからの生命科学には実験と理論の両方が必要であり、当研究室ではそれらの両方ができる人材を育成します。AIなどによる発展が目覚ましいタンパク質デザイン研究に、皆さんも一緒に挑戦しませんか? 理論研究の未経験者も歓迎します。
私たちの目標は、DNAに書かれた「生命のプログラム」を解き明かし、その知見を、産業や医療に役立てることです。生命のプログラムの解読は、生命科学の時代と呼ばれる今世紀の最重要課題です。この問題の解決が科学と社会に与えるインパクトは、物理法則の発見と同等以上であり、人類の持続的発展に大きく寄与することが期待されます。
新井研究室では、この目標に向かって、次のような研究を行っています。特に、近年注目されているデジタル・トランスフォーメーション(DX)や、グリーン・トランスフォーメーション(GX)に向けた取り組みに力を入れています。また、生命科学・物理学・情報科学を融合させ、理論と実験の両面から研究を進めています。
(1)抗がん剤・抗アレルギー薬・抗ウイルス薬として利用可能な新規タンパク質の設計
(2)バイオエネルギーをつくる
(3)酵素活性を向上させる普遍的手法の開発
(4)光遺伝学(オプトジェネティクス)に利用可能なタンパク質の理論的設計
(5)細胞内に存在する物質を定量するためのセンサータンパク質の開発
(6)抗体精製に役立つアフィニティーリガンドの創製
(7)農業生産を効率化するための有用酵素の開発
(1)タンパク質のフォールディング反応機構の解明 〜ポストAlphaFold2時代における新たな研究
(2)天然変性タンパク質の機能発現機構の解明と創薬への応用
(3)タンパク質の構造ダイナミクス解析と機能制御法の開発
(4)食品タンパク質の物性解析
(5)細胞内での「液-液相分離」のメカニズム解明と制御法の開発
(6)ミュータノーム解析に基づくタンパク質構築原理の解明
1.医療や産業に役立つタンパク質をデザインする
生体内での様々な反応を担っているのは、DNAではなく、タンパク質です。タンパク質は、触媒や結合といった働きを通して、物質を生産したり、病原体に結合したりして、生命を維持しています。このような働きは、産業や医療にも役立ちます。目的に応じて、役に立つタンパク質を自由自在にデザインすることができたら、私たちの生活はとても豊かなものになるでしょう。タンパク質のフォールディング問題の解決は、このような未来と直結しています。フォールディング問題は確かに難問ですが、着実に進展しており、おそらく今世紀中に解き明かされ、産業や医療の現場でタンパク質が大いに役立つ日が来ると期待しています。
私たちは、実際に有用タンパク質を設計し作製することによって、デザイン法を発展させ、フォールディング機構の理解を深めることを目指しています。具体的には、次の2つの手法を用いて、以下の目標1〜6のようなタンパク質のデザインに取り組んでいます。
[手法1.理論的設計] 計算機を用いて有用な新規タンパク質を理論的に設計し、産業や医療に応用できれば、私たちの生活は一変するでしょう。あと数十年後にはそのような時代が来ると期待されています。現在私たちは、そのような夢の実現に向けて、医薬品の開発などに役立つタンパク質の理論的設計に取り組んでいます。
具体的には、Rosettaというタンパク質分子設計ソフトウェアを用いて、ターゲット分子に結合するタンパク質や、触媒反応を起こす酵素の立体構造とアミノ酸配列を設計します。そのあと、実際にタンパク質を作製し、設計通りの機能を有することを確認します。理論と実験の両方ができる研究者を育成することも当研究室の目標の一つです。
Rosettaは物理学ベースの手法であるのに対し、最近はAlphaFold 2、Protein MPNN、RFDiffusionなどに代表される深層学習ベースの手法も急速に発展しています。深層学習ベースの手法はタンパク質デザインを容易にしましたが、設計の成功率はまだ高いとは言えません。特に、酵素などのように、ダイナミクス(動き)が重要なタンパク質の設計は依然として困難です。そこで私たちは、物理学ベースの手法と深層学習ベースの手法を組み合わせることで、タンパク質設計の成功率を高めるための手法開発を進めています。このような設計方法は、現在のタンパク質デザイン分野における最先端手法です。また、現在注目されているデジタル・トランスフォーメーション(DX)とまさに合致した取り組みになります。
[手法2.進化分子工学実験] 大量の変異体をランダムに、もしくは網羅的に構築し、その中から高機能化した変異体をスクリーニングします。これを繰り返して「人工進化」を高速に行い、有用タンパク質を創出します。これは2018年にノーベル化学賞を受賞した重要な研究手法です。
なお、ノーベル賞が出た分野の延長線上に次のノーベル賞があると言われています。進化分子工学実験によるタンパク質デザインの次は、理論的手法によるタンパク質デザインに対してノーベル賞が授与されるのではないかと期待されています。
(目標1)抗がん剤・抗アレルギー薬・抗ウイルス薬として利用可能な新規タンパク質の設計
生体内では、例えばAとBという2つのタンパク質同士が結合するとガン細胞が増殖したり、アレルギー反応が起きたり、ウイルス感染が起きたりするといったケースが多々見られます。それらのタンパク質間結合を阻害する物質を作ることができれば、抗がん剤・抗アレルギー薬・抗ウイルス薬として使用できると期待されます。具体的には、Aというタンパク質にBよりも強く結合するタンパク質や、Bというタンパク質にAよりも強く結合するタンパク質を作ることができれば良いわけです。
そこで私たちは、このようなタンパク質やペプチドを、さまざまな理論的設計法によって新規創製することを目指して研究を進めています。特に、がん、白血病、アレルギー性喘息、新型コロナウイルス感染症(COVID-19)に対する創薬を進めます。具体的には、PD-1/PD-L1、c-Myb/MLL/CBP(KIX)、IL-33/ST2/IL-1RAcP、SARS-CoV-2 Spike RBD/抗体などのタンパク質間相互作用をターゲットにしています。また、企業との共同研究も行っています。
タンパク質間相互作用の阻害薬としては抗体が有名です。しかし抗体は巨大なタンパク質であり、その製造コストが高いために高額な医薬品となっています。そこで私たちは、製造が容易な小型タンパク質を用いることで、従来の抗体に代わる「新型小型抗体」の開発を進めています。しかも、理論的設計によってこれを実現できれば、製造費や開発費を大幅に低減させ、医薬品の価格を下げることにも貢献しうると期待されます。
新型コロナウイルス感染症(COVID-19)によって世界中の人々は大きな影響を受けました。近年は6-7年ごとに新興ウイルスが出現しているため、今後もまた同じようなパンデミックが起きる可能性があります。そのときに迅速に対応できるようにするためにも、私たちはウイルス感染を阻止できる阻害剤の理論的・効率的な開発にも取り組んでいます。
(目標2)バイオエネルギーをつくる
東日本大震災後、震災復興のために、生命科学研究の立場から、私たちにできることはないだろうか? 私たちなりに真剣に考え、出した答えが、「バイオエネルギーをつくる」ということでした。この間の経緯については、次のリンクをご参照ください。
「バイオエネルギーをつくる 〜私たちの決意表明」
バイオエネルギーとは、生物から作られる軽油、重油、エタノール、水素などのことであり、化石資源や原子力発電などに代替するエネルギーとして注目を集めています。ラン藻などの藻類は、軽油や重油に相当するアルカン(炭化水素)を作ることができます。このような生物が物質を生産するためには、何等かのタンパク質(酵素)が働いているはずです。それらのタンパク質を高活性化し、アルカン合成を飛躍的に高効率化できれば、バイオエネルギー生産の実用化も夢ではありません。また、藻類は光合成によってアルカンを合成できるため、燃料の使用後に排出された二酸化炭素を再び燃料に戻すことができます。したがって、藻類によるバイオエネルギー生産は、「カーボン・ニュートラル」な再生可能エネルギーと位置づけることができます。近年、このような取り組みはグリーン・トランスフォーメーション(GX)とも呼ばれています。
私たちは現在、ラン藻由来のアルカン合成関連酵素であるAARとADOに注目し、それらを高活性化して、軽油の生産を高効率化させることを目指した研究を展開しています。その目標達成のためには、網羅的変異解析、進化分子工学、X線構造解析、NMR法、計算機モデリングなど、手段を選ばずに、全力で取り組んでいきます。
(目標3)酵素活性を向上させる普遍的手法の開発
Rosettaソフトウェアを用いた理論的なタンパク質設計では、タンパク質間の結合を強める変異体の設計などが多く行われています。しかし、酵素反応を理論的に高活性化させた例はほとんどなく、これを可能とする普遍的な手法の開発は重要な課題となっています。私たちは最近、これを可能とする理論的手法の開発に成功しました。現在は、この手法の普遍性を確認するために、さまざまな酵素に本手法を適用した研究を進めています。
(目標4)オプトジェネティクス(光遺伝学)に利用可能なタンパク質の理論的設計
オプトジェネティクス(光遺伝学)とは、光でタンパク質を操作する遺伝学的手法のことであり、生命科学実験に利用できるだけでなく、医療への応用も期待されています。光遺伝学においては、光を当てたときに、タンパク質の構造が変化したり、別のタンパク質と結合したりといった反応をさせることが重要です。そこで、そのような制御が可能なタンパク質を、理論的手法を使って設計しています。
(目標5)細胞内に存在する物質を定量するためのセンサータンパク質の開発
細胞内に存在する物質を可視化できれば、その物質がいつ、どこに、どのくらい存在しているのかを明らかにできます。これによって、病気の発症メカニズムの解明や、生命科学の基礎研究の発展に貢献できます。現在私たちは、理論的手法を用いて、このようなセンサータンパク質の開発に取り組んでいます。
(目標6)抗体精製に役立つアフィニティーリガンドの創製
抗体は、生体内での免疫応答における重要なタンパク質であり、細菌やウイルスなどを認識して結合し、病気を防いでいます。現在、抗体は医薬品として使われ始めており、副作用の少ない次世代医薬品として注目されています。
抗体は培養細胞の中で作られますが、その中から抗体のみを取り出して精製するときには、親和性クロマトグラフィーという手法が用いられます。このクロマトグラフィー用カラムに入っている粒子(Resin)には、抗体のみに結合できるタンパク質(Protein Aなど)が付加されています。このようなタンパク質のことを、アフィニティーリガンドと呼びます。中性pHにおいて、培養液を親和性カラムに流すと、抗体のみがカラムに結合し、不用成分はすべて洗い流されます。通常では次に、pHを酸性にして、抗体をカラムから取り外します。しかし、抗体は酸性pHで部分的に変性し、凝集体を形成する可能性があります。このような凝集体が医薬品に混入すると、副作用を生じる可能性も指摘されています。
そこで、安心・安全な医薬品を作るには、できるだけpHを中性に近い条件で抗体をカラムから解離させる必要があります。私たちは、フォールディング研究から得られた知識を応用して、このようなアフィニティーリガンドのデザインを行っています。
(目標7)農業生産を効率化するための有用酵素の開発
農業においてリンは肥料の重要な成分ですが、その原料であるリン鉱石は100年以内に枯渇すると予測されています。それゆえ、持続的な食糧生産を可能とするためには、少量のリン肥料であっても植物が効率的にリンを取り込めるようにすることが必要です。現在私たちは、これを可能とする有用酵素の開発をすすめています。
2.タンパク質のフォールディング問題を解く
DNAに書かれた遺伝情報は、RNAに転写され、タンパク質へと翻訳されます。合成されたタンパク質は、アミノ酸が鎖状につながった一次元的な紐に過ぎず、このままでは機能を発揮できません。紐状のタンパク質は、特異的な三次元の立体構造を形成する(フォールディングする)ことによって機能を発現できるようになります。つまり、遺伝情報発現の最終段階は、タンパク質のフォールディングというプロセスです。
では、あるアミノ酸の配列が与えられたとき、タンパク質はどのような立体構造を形成し、どのような機能を発揮するのでしょうか? また、タンパク質は、どのようにして特異的な立体構造へとフォールディングするのでしょうか? これらの問題を総称して「タンパク質のフォールディング問題」と呼びます。この問題は、第二の遺伝暗号解読問題とも呼ばれ、50年以上も未解決の難問です。
2020年に、この分野において革命的なことが起きました。それは、AlphaFold 2という深層学習ベースのソフトウェアの出現です。AlphaFold2は、アミノ酸配列を入力すると、そのタンパク質がとりうる立体構造を正確に予測してくれます。その予測精度は、タンパク質の立体構造を実験で決定するのと同じくらい高く、今後はタンパク質の立体構造決定の研究が不要になるのではないかと言われるほどです。
しかし、AlphaFold 2にもできないことがあります。それは、タンパク質のフォールディング反応過程やメカニズムの予測です。また、タンパク質がどのように動いて機能を発揮するのかについても予測できません。タンパク質は特定の構造にフォールディングした後、ダイナミックに動いて機能を発揮しますので、AlphaFold 2で立体構造を予測することが可能になっても、タンパク質のフォールディング機構やダイナミクスを予測できるようにならなければ、「タンパク質のフォールディング問題」が解けたとは言えません。そこで私たちは、この重要課題の解決を目指して研究を進めています。
この問題を解くためには、生物、物理、化学、バイオインフォマティクス、タンパク質工学などの実験的・理論的手法を駆使し、手段を選ばずに研究をすることが大切です。私たちの研究室では、様々なバックグラウンドを持つ人たちが集まり、新しい手法の開発と応用、および、実験と理論の融合を心がけながら、研究を進めています。主に次のようなテーマに取り組んでいます。
(1)タンパク質のフォールディング反応機構の解明
〜ポストAlphaFold2時代における新たな研究とは
生体内でつくられたタンパク質が特異的な天然構造へとフォールディングしていく反応過程は、これまでに様々な実験によって明らかになりつつあります。しかし、その反応過程を理論的に予測できて初めて、タンパク質のフォールディング反応機構を解明できたと言えます。そこで私たちは、統計力学理論を用いて、タンパク質がとりうる構造の「自由エネルギー地形」を描くことを目指した研究に取り組んでいます。この理論はWako-Saito-Munoz-Eaton (WSME) モデルと呼ばれており、これまでに、アミノ酸残基数が100以下の小さなタンパク質のフォールディング反応過程の予測に成功してきました。しかし、タンパク質の平均的なサイズは200-300残基であり、あらゆるタンパク質に普遍的に適用可能な理論はまだありませんでした。
私たちは最近、この理論を大幅に改良し、あらゆるタンパク質に適用できる理論の構築に成功しました(
Ooka & Arai (2023) Nature Communications, 14: 6338)。この理論により、例えば下図のような自由エネルギー地形を描くことができ、タンパク質がどのような経路を通ってフォールディングしていくのかをすぐに予測できます。また、反応速度、経路上で形成する構造などもすべて予測可能です。例えるならば、折り鶴の形を見ただけで、その形になるような折り方をすべて予測できることに相当します。また、鶴だけでなく、どんな形であっても、その作り方を予測できることに相当します。
この成果は、数十年来の難問であるタンパク質のフォールディング問題を解決する上での重要な一歩として期待されています。また、この理論はタンパク質のフォールディング反応だけでなく、さまざまな構造ダイナミクスの予測にも適用できることから、タンパク質の機能の予測や、酵素反応速度(kcat, Km)の予測なども可能になり、新たなタンパク質設計法の開発にもつながると期待されます。
これからやるべきことはたくさんあります。例えば、@この理論をさまざまなタンパク質に適用し、それらのタンパク質のフォールディング反応過程やメカニズムを正確に予測できることを検証する、Aそれらの結果に基づき、タンパク質のフォールディング反応機構を統一的に理解する、Bタンパク質が機能を発揮する際の構造変化(ダイナミクス)を予測する、C酵素反応の速度(kcat, Km)を予測する、Dタンパク質のアミノ酸置換変異体にこの理論を適用し、結合反応速度や酵素反応速度をはやめた変異体を設計可能にする、E全タンパク質の構造ダイナミクス(自由エネルギー地形)を予測し、それらのデータベースをつくる、Fこのデータベースを深層学習し、タンパク質のダイナミクスを予測する人工知能(AI)をつくる、などです。これこそが、ポストAlphaFold2時代における新たな研究であり、その成果は創薬や産業利用などに直結しています。重要な点は、これを可能とするためには、生命科学だけではなく、物理学や情報科学などが必要になるということです。
この他に、様々な分光学的手法と高速反応計測法を組み合わせることにより、タンパク質のフォールディング反応を直接観測し、その反応速度や中間体の描像を明らかにする研究も行っています(下図)。また、分子動力学シミュレーションなどの理論的手法により、原子レベルの分解能でフォールディング反応の様子を明らかにすることを目指します。このように理論と実験の両面から、タンパク質のフォールディング現象に迫っていきます。
タンパク質のフォールディング反応機構についての知見は、産業利用可能な様々なタンパク質を、企業等で工業生産する上でも極めて有用です。医療や産業では、精製したタンパク質をin vitroで用いることが多いですが、生体内から取り出したタンパク質は不安定で扱いにくく、本来の機能を発揮できないことが多々あります。また、細胞外に分泌されるタンパク質には多くのジスルフィド結合があり、それらをin vitroで効率的に合成することは至難の業です。しかし、こうした問題を解決できれば、医療・産業用のタンパク質を安価で大量に生産でき、タンパク質の社会利用を推進できます。私たちは大腸菌を用いたタンパク質の大量発現や、タンパク質のリフォールディング(巻き戻し)、タンパク質の安定性の研究などにおいても多くの経験を有しています。
(2)天然変性タンパク質の機能発現機構の解明
従来、タンパク質は、特定の立体構造を形成して初めて機能を発現すると考えられてきました。しかし、最近発見された「天然変性タンパク質」は、生理的条件下では変性した構造を持ちますが、標的分子の認識という機能発現に伴って初めてフォールディングすることがわかり、従来の固定概念をくつがえす新たなパラダイムとなっています。しかも、天然変性タンパク質は高等生物が持つタンパク質の約4割を占め、転写・翻訳・シグナル伝達などの重要な生命現象に関与しています。そこで、天然変性タンパク質のフォールディングと分子認識のメカニズムを明らかにし、天然変性タンパク質の機能発現機構の解明を目指します。
現在、白血病などに関わる転写因子c-MybやMLL、ヒト免疫不全ウイルスHIV-1由来の天然変性タンパク質Tat、HER2結合タンパク質Herstatinなど、病気に関わる様々な天然変性タンパク質の構造解析や、標的分子認識機構などについて研究を進めています。さらに、それらの知見を、これらの疾患の治療薬開発に応用することも進めています。
(3)タンパク質の構造ダイナミクス解析と機能制御法の開発
タンパク質は、フォールディングして特定の構造を形成したあと、石のように固まっている訳ではありません。タンパク質は熱的揺らぎなどによって、まるで生きているかのようにダイナミックに動き、多様な機能を発揮します。生物の生き生きとした動きは、タンパク質の特性に由来しているのです。そして、このようなタンパク質の振る舞いは全て、タンパク質のアミノ酸配列の中にプログラムされています。
そこで私たちは、タンパク質がどのように動いて機能を発揮するのかを、核磁気共鳴(NMR)分光法などを用いて解析しています。特に、最もダイナミックに動くタンパク質である天然変性タンパク質や、ダイナミクス研究における代表的なタンパク質であるジヒドロ葉酸還元酵素(DHFR)などを用いて研究を進めています。
さらに、得られた知見に基づいて、これらのタンパク質を高性能化(高活性化)する変異体を構築することにより、タンパク質の機能を制御する方法の開発を目指します。
(4)食品タンパク質の物性解析
食品の中にはタンパク質が多く含まれています。例えば、牛乳にはαラクトアルブミンやβラクトグロブリン、卵にはオボアルブミンやリゾチームといったタンパク質が大量に含まれています。私たちはこれまで、こうしたタンパク質のフォールディングや変性などの物性を物理化学的な手法を用いて詳細に解析してきました。これらの知見は、食品加工などにおいても大いに役立つと期待されます。
(5)細胞内での「液-液相分離」のメカニズム解明と制御法の開発
天然変性タンパク質によって引き起こされる「液-液相分離」(膜のないオルガネラ)は、細胞生物学における最もホットな話題のひとつです。この機構解明と制御法の開発を行い、相分離生物学を切り拓くことを目指します。また、液-液相分離を利用して、酵素などが効率的にはたらく反応場を設計し、その制御も可能とすることにより、物質生産への応用を目指します。
(6)ミュータノーム解析に基づくタンパク質構築原理の解明
〜あるアミノ酸配列が与えられたとき、タンパク質はどのような立体構造を形成し、
どのような機能を発揮するのか?
アミノ酸配列情報のみから、タンパク質の立体構造と機能を予測可能にすることは、生命のプログラムを解読することそのものです。この問題を解決するには、配列・構造・機能についてのデータベースが必要です。そこで、タンパク質に様々なアミノ酸置換変異を網羅的に導入し、各変異体の構造と機能を測定することにより、配列・構造・機能のデータベースを構築します。そして、このデータベースを解析し、配列情報のみからタンパク質の構造・機能を予測する方法を開発することを目指します。このように、網羅的な変異体のデータベースに基づく解析のことを、ミュータノーム解析と名付けます。ミュータノーム(mutanome)とは、変異体(mutant)+総体(-ome)という意味の造語であり、新たなオミクス解析技術です。 現在、アルカン合成に関与する酵素をモデルに用いて、ミュータノーム・データベースの構築を行っています。このデータベース構築は、有用なタンパク質のデザインにも直結します。
次に、機械学習や深層学習によってタンパク質のアミノ酸配列・構造・機能のデータベースを理論的に解析し、アミノ酸配列情報のみからタンパク質の立体構造と機能を予測する方法を開発することを目指します。