Clear Sky Science · ja
ProteoAutoNet:ロボットと機械学習による高スループット共溶出タンパク質解析
なぜタンパク質の協働を理解することが重要か
細胞の内部で、タンパク質はめったに単独で働きません。構造を作り、DNAを複製し、傷んだ部分を分解し、成長のエネルギーを供給するために、刻々と変わる同盟を組んで機能します。多くのがんはこれらの協働を乗っ取りますが、その詳細を地図化する作業は遅く、手間のかかるものでした。本研究はProteoAutoNetを紹介します。ロボットと機械学習を組み合わせたシステムで、細胞内のタンパク質の協働を発見する速度を大幅に高め、甲状腺がんにおける隠れた脆弱性を明らかにする可能性を示します。

より速いタンパク質協働解析の仕組みを構築する
従来、科学者は共分画質量分析(co-fractionation mass spectrometry)という手法を用いて大きなタンパク質複合体を分離し、その構成要素を同定してきました。強力な方法ですが、労力がかかりスループットが低いという欠点があります:数百の分画を手作業で準備するには何日もかかることがあります。著者らはこのワークフローの大部分を自動化するロボット支援プラットフォームを構築しました。細胞内容物は最初に優しく破砕されて天然のタンパク質複合体が保持され、その後サイズ別カラムを通して数十の分画に分けられます。リキッドハンドリングロボットやロボットアームが化学試薬の添加、タンパク質の消化、サンプルの精製を引き継ぎ、質量分析計への供給まで行います。この構成は複数の甲状腺細胞株から最大540分画をわずか2~3日で処理でき、従来の半自動システムに比べて概ねスループットを倍増させます。
速いだけでなく、より信頼できるロボット
結果が雑音まみれや不安定では、速度だけでは不十分です。チームはロボットパイプラインが従来の手作業処理と同等以上の品質を出すかを慎重に検証しました。品質管理サンプルを用いて、自動化システムが甲状腺細胞株ごとにほぼ3,000のタンパク質を繰り返し同定し、再現実験間で高い重複率とタンパク質量の強い一致を示すことを示しました。同一サンプルをロボット処理と手作業処理で直接比較すると、両者とも検出タンパク質数は類似していましたが、ロボット法はカウントのばらつきがやや小さく、タンパク質の豊富さの測定がより安定していました。これは新しいプラットフォームが時間と労力を節約するだけでなく、より再現性の高い実験を支えることを意味します。再現性は大規模研究や臨床応用に不可欠です。
意味のある結びつきを識別するためにコンピュータを教える
高速の装置があっても中心的な課題は残ります:どのタンパク質が真に相互作用しているのか、それとも単に同時に現れているだけなのかを判断することです。これに対処するために著者らは、キュレーションされたタンパク質複合体データベースとXGBoostアルゴリズムに基づく機械学習モデルを組み合わせました。まず3つの主要なタンパク質複合体リソースをクリーンアップして統合し、96,635件の既知のタンパク質–タンパク質相互作用を得ました。次に、分画にわたるタンパク質の出現プロファイルを入力特徴量として使用し、データベースに基づいてペアをパートナーと非パートナーにラベル付けしました。実際の高信頼の協働は比較的まれであるため、ターゲットを絞ったデータ拡張戦略を使用しました:既知の正例のわずかに摂動した多数のバージョンを作成し、モデルに特定のトレースを記憶させるのではなく、堅牢なパターンを認識させるように学習させました。3つの甲状腺細胞株から数千万件のこうした例で訓練されたモデルは、内部テストと独立した検証細胞株のいずれでも、ランダムよりはるかに上位に真の相互作用を正しくランキングするなど高い性能を発揮しました。
がん細胞の機械装置に関する新たな視点
このワークフローを用いて、研究者らは正常な甲状腺細胞株と2つのがん性細胞株(乳頭状甲状腺癌株と肺に転移することがある濾胞性癌株)で相互作用ネットワークを描きました。これらの細胞を通じて、25,000件を超える可能性の高いタンパク質相互作用を同定し、リボソーム(タンパク質を合成する機構)やプロテアソーム(タンパク質を分解する機構)など既知の細胞マシンから強いシグナルを検出し、手法が既存の生物学を復元していることを確認しました。がんと正常株を比較することで、病態で強く働いているネットワークを明らかにしました。転移性の濾胞性癌細胞では、プロテアソーム成分とシャペロン複合体であるプレフォルディンが顕著により多く連結し、量も増加していました。いくつかのプレフォルディンサブユニットは他のがんと関連づけられてきましたが、全体的なタンパク質サーベイでは甲状腺がんにおけるそれらの協調的な挙動を見逃していた可能性があります。これはこれらのタンパク質が分解で厳密に制御されているためかもしれません。共分画アプローチは複合体レベルでの協調変化を露わにしました。

今後の治療につながる可能性のある隠れたつながり
この研究はまた、甲状腺がんの増殖や転移に影響する可能性のある特定の相互作用を浮き彫りにしました。例の一つは、主要な糖代謝経路を開始する酵素HK1と、甲状腺腫瘍の浸潤や転移を促すことが知られるタンパク質TGM2との予測される結びつきです。このHK1–TGM2のつながりは既存の相互作用データベースにはなかったものの、構造モデリングによって支持され、乳頭状癌株で特に活性化しているように見えました。これにより代謝の再配線と浸潤性の振る舞いが物理的に結びつく可能性が示唆されます。総じて、ProteoAutoNetはロボット工学と機械学習を組み合わせることで、遅く専門家に限られたタンパク質ネットワークの地図化をより拡張可能なプロセスに変えうることを示しています。専門外の読者にとっての要点は、この技術が細胞機械の広範な変化と、いつか医師がどの甲状腺がんが攻撃的に振る舞うかをよりよく予測し、新しい治療標的を示唆するのに役立つかもしれない予期せぬタンパク質の結びつきの両方を発見できるということです。
引用: Lyu, M., Hu, P., Zhang, G. et al. ProteoAutoNet: high-throughput co-eluted protein analysis with robotics and machine learning. Nat Commun 17, 1949 (2026). https://doi.org/10.1038/s41467-026-68686-9
キーワード: タンパク質相互作用, 質量分析法, 生物学における機械学習, 甲状腺がん, プロテアソームとプレフォルディン