OpenAIが科学分野に参入?GPT-4b Microの概要を徹底解説!

OpenAI 科学分野 GPT-4b Micro 概要

WEELメディア事業部AIライターの2scです。

みなさん!MIT Technology Reviewの取材で、「OpenAIがノーベル賞級の研究に取り組んでいる」ことがわかりました。

そのなかで明らかになったのは、タンパク質設計用LLM「GPT-4b Micro」の存在です。こちらはなんと、再生医療のキーアイテム「iPS細胞」の作成過程を、従来比で最大50倍効率化する方法を発見したとのこと。取材内容が本当だとすれば、これはノーベル賞級の発見です。

当記事では、そんなGPT-4b Microのすごさにクローズアップ!実は、某国立大学の応用生物学部を卒業しているライター・2scが専門用語を極力省いてわかりやすく解説していきます。

完読いただくと、生成AIと再生医療の基礎知識が一度にマスターできる……かも。ぜひぜひ、最後までお読みください!

目次

OpenAIのタンパク質設計用LLM「GPT-4b Micro」

MIT Technology Reviewの取材で、OpenAIが科学分野へ参入し、タンパク質の設計に特化した小型LLM「GPT-4b Micro」を開発中であることが明らかになりました。GPT-4b Microの特徴は以下のとおり、衝撃的です。

GPT-4b Microの特徴(※1)
  • OpenAI社とRetro Biosciences社による1年の共同研究の結晶
  • タンパク質の設計に特化した小型(Micro)のLLM
  • さまざまな生物のタンパク質の設計図を学習
  • iPS細胞作成に欠かせない「山中因子」を改良し、その効果を最大50倍UP
    →科学者が独自に設計したものを圧倒的に上回る成果

もし、この取材内容が本当なのだとすれば、再生医療の進歩・普及が大幅に加速するはず。Google DeepMindの「AlphaFold」に続いて、OpenAIがノーベル賞を獲ってしまうかもしれません。当記事では、そんなGPT-4b Microのすごさを、生物系学部卒のライターがお伝えしていきます。

ちなみに、OpenAIと共同研究をしたRetro Biosciences社といえば、サム・アルトマンCEOが個人名義で1億8000万ドルを投資した話題のスタートアップ。「人間の健康寿命を10年延ばす」ことが目標の長寿研究企業です。

GPT-4b Microのすごいところ

では早速、タンパク質設計用LLM「GPT-4b Micro」のすごいところを、生物系学部卒のライターが専門用語を極力省いてわかりやすく解説していきます。それでは以下、学習データと基本の機能からみていきましょう!

タンパク質の設計図を学習

GPT-4b Microは、さまざまな生物種がもつ「タンパク質の設計図」を学習した言語モデル。まるでChatGPTが文章を生成するように、エラーのないタンパク質の設計図が生成できるとされています。以下、その原理をひも解いていきましょう。

タンパク質とはそもそも、20種類のアミノ酸が無数に連結し、糸状になって絡まったもの。アミノ酸をしかるべき順番で繋ぐと、以下のステップで正しく絡み合い、グロブリン(抗体)やヘモグロビン(血液)のように正しく機能するタンパク質が完成します。

  1. 20種類のアミノ酸が無数に連結した、糸状の「一次構造」
  2. アミノ酸の糸が、らせん状 or シート状に規則正しくまとまった「二次構造」
  3. らせん状・シート状・糸状のアミノ酸が連結して絡まった「三次構造」
  4. 三次構造が規則正しく合体した「四次構造」

この「アミノ酸を適切な順番に並べる」というのがポイントで、これはちょうど単語を並べて本を作る工程にそっくり。具体的には下表のとおり、どちらも規則正しい配列からなり、複数のレイヤー構造を有しています。

スクロールできます
概要本にたとえると
一次構造20種類のアミノ酸が無数に連結した糸単語が並んだ「文章」
二次構造アミノ酸の糸が、
らせん状 or シート状に
規則正しくまとまったもの
文章がまとまった「段落」
(各文に起承転結の役割あり)
三次構造らせん状・シート状・糸状の
アミノ酸からなる立体
起承転結の段落が集まった「見出し・章」
四次構造アミノ酸の立体(サブユニット)
が規則正しく合体したタンパク質
各章からなる一冊の「本」

OpenAIの開発チームはどうやらここに注目したようす。言語モデルに下記を学習させることで、タンパク質を正しく設計できるGPT-4b Microを開発したようです。(※1)

  • さまざまな生物種のタンパク質における、アミノ酸20種類の並び方(配列)
  • 同上について、特定の位置にアミノ酸が並んだ時の絡まり方(相互作用)

このプロセスが功を奏し、GPT-4b Microは次に説明する驚愕の結果を生みだした……とのことです。

大胆なアイデアでタンパク質を改良

GPT-4b Microは実験段階において、人間の研究者を超えるアイデアで、タンパク質の設計図を大幅に改良できたそうです。この実験に際しては、分化しきった体細胞をiPS細胞に初期化するタンパク質の設計図「山中因子」が用いられています。そこも込みで、詳しくみていきましょう!

そもそも「iPS細胞」とは、人為的に作られた、あらゆる細胞に分化できる細胞(人工多能性幹細胞)のこと。特定の役割に不可逆的に分化してしまった多くの体細胞とは違い、表皮細胞 / 筋細胞 / 神経細胞 / 免疫細胞…etc.何にでもなれる可能性を秘めていて、再生医療での活躍が期待されています。

このiPS細胞は下図のとおり、体細胞にタンパク質の設計図4種「山中因子」を導入し、細胞初期化を起こすことで作られます。

なのですが、この山中因子には下記のような課題があり、研究者らによって日夜改良が進められてきました。

山中因子における課題(※1、2)
  • c-Mycを筆頭に、iPS細胞をがん細胞に変えてしまうリスクがある
  • 細胞初期化が完了するまでには数週間を要する
  • 細胞初期化の成功率は1%にも満たない

そこでGPT-4b Microが活躍します。GPT-4b MicroにFew-Shotプロンプトで山中因子の設計例を示して改良を依頼したところ……衝撃的な山中因子の設計図が返ってきたとのこと。気になる結果は下記のとおりです。

● 設計図の1/3以上を大胆にも変更し、破綻のない改良案を提案
● 予備計測では、山中因子4種のうち2種の効果を50倍以上もUP

OpenAIの研究者曰く、「全体的にGPT-4b microが生成したタンパク質は、科学者が独自に設計したものより優れている傾向にある」とのこと。もしこれが本当だとしたら、パーキンソン病や糖尿病のような治療困難な疾病が治るようになる……かもしれません。

なお、同じく衝撃的なOpenAIのLLM「o3」について詳しく知りたい方は、下記の記事を合わせてご確認ください。

OpenAI「GPT-4b Micro」とGoogle「AlphaFold」の比較

2024年に開発者がノーベル化学賞を受賞したGoogle DeepMindの「AlphaFold」も、GPT-4b Microと同じく、タンパク質設計用のAIモデルです。

参考:https://deepmind.google/technologies/alphafold/

なのですが、AlphaFoldとGPT-4b Microのしくみは下表のとおり大きく異なります。(※3、4)

スクロールできます
AlphaFold(AlphaFold 3)GPT-4b Micro
搭載技術拡散モデル(Diffusion Model)言語モデル(詳細不明だが、おそらくTransformer)
近い生成AI画像生成AI(例:StableDiffusion / DALL-E 3 / Midjourney…etc.)大規模言語モデル(例:ChatGPT / Claude / Gemini…etc.)
動作原理タンパク質全体の構造・絡まり方を予測アミノ酸の並び方を予測

OpenAIの研究者曰く、「山中因子は柔軟・不定形なタンパク質の設計図である」とのこと。タンパク質の形よりも、アミノ酸の並び方にフォーカスを当てたほうが効率よく設計できるそうです。

なお、AlphaFold 3について詳しく知りたい方は、下記の記事を合わせてご確認ください。

GPT-4b Microが実現する未来

今回明らかになったGPT-4b Microの実力が本当だとすれば、これまで「不治の病」とされていた疾病が再生医療で治療できるようになるかもしれません。具体的に、GPT-4b MicroによるiPS細胞の作成効率化で実現できそうなことは下記のとおりです。

iPS細胞の作成効率化で実現しそうなこと(※5)
  • 加齢黄斑変性(失明の主な原因)の治療:患者の網膜黄斑部にiPS細胞で作った視細胞を導入
  • 糖尿病の治療:患者のすい臓にiPS細胞で作ったインスリン産生細胞を導入
  • パーキンソン病の治療:患者の脳にiPS細胞で作ったドーパミン産生細胞を導入
  • 重度の心臓病の治療:患者の心臓にiPS細胞で作った心筋細胞片 or 心筋シートを導入
  • 半身不随の治療:患者の脊髄にiPS細胞で作った神経細胞を導入
  • 以上、再生医療の普及:iPS細胞がより低コストかつ安全に作成可能に

これらの再生医療が当たり前になるのは案外、近い将来のことなのかもしれませんね。

GPT-4b Microの懸念点

GPT-4b Microについては下記のとおり、疑問の声も上がっています。

GPT-4b Microの懸念点(※1)
  • そもそもが嘘である可能性AGI開発の資金調達を有利に進めるための方便かもしれない
  • 実験結果に再現性がない可能性:OpenAIの研究者ですら、動作原理を完全には理解できていない

今後、OpenAIから正式な発表があるかもしれませんので、続報を待ちましょう!

なお、医療現場における生成AIの可能性について詳しく知りたい方は、下記の記事を合わせてご確認ください。

GPT-4b Microで「不治の病」が治る……かも

当記事では、OpenAIが開発を進めているとされるタンパク質設計用LLM「GPT-4b Micro」についてご紹介しました。以下にてもう一度、MIT Technology Reviewの取材で明らかになったGPT-4b Microの特徴を振り返っていきましょう!

GPT-4b Microの特徴(※1)
  • OpenAI社とRetro Biosciences社による1年の共同研究の結晶
  • タンパク質の設計に特化した小型LLM
  • さまざまな生物のタンパク質の設計を学習
  • iPS細胞作成に欠かせない「山中因子」を改良し、その効果を最大50倍UP

もし、取材内容が本当なのだとすれば、これはノーベル賞級の発見です。iPS細胞はこれまで「不治の病」とされてきた疾病(糖尿病 / パーキンソン病 / 心臓病 / 半身不随…etc.)を治すかもしれない再生医療のキーアイテム。その作成をGPT-4b Microが大幅に効率化することで、再生医療が実用化&普及すると考えられます。

ただ、真偽のほどはまだ不確かですので、続報を待ちましょう!

最後に

いかがだったでしょうか?

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
メルマガ登録

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • 2sc

    テクニカルライター 大学時代はアリの生態を研究。 ラボで唯一、Pythonを使ってデータ分析を効率化していた。 現在はライターとして、オウンドメディアや学術記事の執筆に当たっている。

  • URLをコピーしました!
  • URLをコピーしました!
目次