チャットGPT
クレジット: FlashMovie/Getty Images
薬物検査プログラムを実行することは、大規模なカクテル パーティーを開催し、その議事を傍聴するようなものです。 カクテルパーティーでは世間話はたくさんありますが、有意義な会話はほんのわずかです。 同様に、薬物スクリーニング プログラムでは、弱い薬物と標的の相互作用の数が、高親和性結合の場合よりもはるかに多くなります。
カクテルパーティーの冗談を隅々まで聞かなければならないとしたら、想像してみてください。 確かに、それは面倒でしょう。 ここで、典型的な薬物スクリーニングですべての薬物と標的の相互作用を評価することがどれほど悪いかを考えてみましょう。 それは、典型的な人工知能 (AI) システムである、最も忍耐強い聞き手ですら疲れ果ててしまうでしょう。
残念ながら、従来の AI システムでは、薬剤候補とタンパク質標的の間の相互作用に関するデータを選別するのに長い時間がかかります。 ほとんどの AI システムは、アミノ酸配列から各標的タンパク質の三次元構造を計算し、それらの構造を使用してどの薬物分子と相互作用するかを予測します。 このアプローチは徹底的ですが、時間がかかります。
物事をうまく進めるために、MIT とタフツ大学の研究者は、大規模言語モデルとして知られる AI アルゴリズムの一種に基づく代替計算アプローチを考案しました。 これらのモデル (よく知られた例の 1 つは ChatGPT) は、膨大な量のテキストを分析し、どの単語 (この場合はアミノ酸) が一緒に出現する可能性が最も高いかを判断できます。 MIT/Tufts チームによって開発された大規模な言語モデルは、ConPLex として知られています。 分子の構造を計算するという計算量の多いステップを実行することなく、標的タンパク質と潜在的な薬物分子を照合することができます。
ConPLex の詳細は、6 月 8 日に PNAS に掲載された「タンパク質言語空間における対照学習は、薬物とタンパク質標的間の相互作用を予測する」というタイトルの記事に掲載されました。 ConPLex は、事前トレーニング済みタンパク質言語モデル (「PLex」) の進歩を活用し、タンパク質アンカー型コントラスト共埋め込み (「Con」) を採用して、最先端のアプローチを上回るパフォーマンスを発揮できます。
「ConPLexは、高い精度、目に見えないデータへの広範な適応性、おとり化合物に対する特異性を実現している」と記事の著者は書いている。 「学習した表現間の距離に基づいて結合を予測し、大規模な化合物ライブラリーやヒトのプロテオームの規模での予測を可能にします。」
次に研究者らは、プロテインキナーゼとして知られる51種類の酵素に結合する能力について、約4,700個の候補薬剤分子のライブラリーをスクリーニングすることでモデルをテストした。
研究者らは、上位のヒットの中から、実験的にテストするための 19 の薬物とタンパク質のペアを選択しました。 実験により、19 のヒットのうち 12 が強い結合親和性 (ナノモル範囲) を持っていたのに対し、他の多くの考えられる薬物-タンパク質ペアのほぼすべては親和性を持たないことが明らかになりました。 これらのペアのうち 4 つは、非常に高いサブナノモルの親和性 (非常に強いため、10 億分の 1 分のオーダーの微量の薬物濃度でタンパク質を阻害する) で結合しました。
研究者らはこの研究では主に低分子薬のスクリーニングに焦点を当てたが、現在はこのアプローチを治療用抗体など他の種類の薬剤にも適用することに取り組んでいる。 この種のモデリングは、動物モデルで試験する前に、潜在的な薬剤化合物の毒性スクリーニングを実行して、望ましくない副作用がないことを確認するのにも役立つ可能性があります。
「この研究は、潜在的な薬剤候補の効率的かつ正確なインシリコスクリーニングの必要性に対処するものです」と、MITの研究者であり、新しい研究の上級著者の1人であるボニー・バーガーは述べた。 「[我々のモデルは] オフターゲット効果の評価、薬物の再利用、および薬物結合に対する変異の影響を判定するための大規模なスクリーニングを可能にします。」
マサチューセッツ工科大学の研究者であり、この研究の筆頭著者の一人であるロヒット・シン氏は、「創薬に非常に費用がかかる理由の一つは、失敗率が高いことにある」と指摘する。 「この薬はうまくいかない可能性が高いと前もって伝えることで失敗率を減らすことができれば、創薬コストの削減に大いに役立つ可能性があります。」
コメントを残すにはログインしてください